Aufwandseinschätzung Kombination mehrerer KI-Algorithmen

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
G-Rizzle
User
Beiträge: 90
Registriert: Donnerstag 18. Februar 2021, 12:26

Hi!

ich nutze einen Instanzsegmentationsalgorithmus zur Erkennung von Objekten auf Bildern. Kurze Erklärung (so weit ich es richtig verstanden habe): Objekterkennungsalgorithmen geben einen rechteckigen Bereich innerhalb eines Bilder, wo ein Objekt erkannt wurde, also eine Bounding Box um das Objekt. Instanzsegmentierungsalgorithmen können aufs Pixel genau ein erkanntes Objekt erkennen und über eine Maske wiedergeben.

Ich nutze folgenden Algorithmus:

https://github.com/matterport/Mask_RCNN

Die Ergebnisse sind...okay. Ich erreiche durch Objekterkennungsalgorithmen wie YOLO bessere Bounding Boxes (nur kann dieser eben nicht das erkannte Objekt aufs Pixel genau einzeichnen).

Meine Idee war nun folgende: YOLO für die Detektion von Bounding Boxes zu nehmen, und diese Informationen zu nutzen, um den MRCNN-Algorithmus dann innerhalb dieses Rechtecks suchen zu lassen.
Sprich: Dem MRCNN vordefinierte Regions of Interests zu geben (die aus der YOLO-Erkennung kommen).

Kann jemand seine Gedanken zu meiner Idee sagen? Ergibt das Sinn oder übersehe ich irgendwas? Kann hier jemand ungefähr den Aufwand dafür abschätzen?

Beste Grüße
__deets__
User
Beiträge: 14545
Registriert: Mittwoch 14. Oktober 2015, 14:29

Solche Pipelines sind absolut normal. Insofern tust du da nichts ungewoehnliches. Welchen Aufwand das bedeutet kann ich nicht einschaetzen - der Teufel steckt wie immer im Detail. Weshalb solche Projekte eine ganze Menge Zeit verschlingen, weil es eben genau nicht 08/15 "mach mal ne Webseite zum eingeben einer Email fuer ein Topp Gewinnspiel" ist.
Antworten