Aufwandseinschätzung Kombination mehrerer KI-Algorithmen

G-Rizzle · Mittwoch 30. März 2022, 15:04

Hi!

ich nutze einen Instanzsegmentationsalgorithmus zur Erkennung von Objekten auf Bildern. Kurze Erklärung (so weit ich es richtig verstanden habe): Objekterkennungsalgorithmen geben einen rechteckigen Bereich innerhalb eines Bilder, wo ein Objekt erkannt wurde, also eine Bounding Box um das Objekt. Instanzsegmentierungsalgorithmen können aufs Pixel genau ein erkanntes Objekt erkennen und über eine Maske wiedergeben.

Ich nutze folgenden Algorithmus:

https://github.com/matterport/Mask_RCNN

Die Ergebnisse sind...okay. Ich erreiche durch Objekterkennungsalgorithmen wie YOLO bessere Bounding Boxes (nur kann dieser eben nicht das erkannte Objekt aufs Pixel genau einzeichnen).

Meine Idee war nun folgende: YOLO für die Detektion von Bounding Boxes zu nehmen, und diese Informationen zu nutzen, um den MRCNN-Algorithmus dann innerhalb dieses Rechtecks suchen zu lassen.
Sprich: Dem MRCNN vordefinierte Regions of Interests zu geben (die aus der YOLO-Erkennung kommen).

Kann jemand seine Gedanken zu meiner Idee sagen? Ergibt das Sinn oder übersehe ich irgendwas? Kann hier jemand ungefähr den Aufwand dafür abschätzen?

Beste Grüße

__deets__ · Mittwoch 30. März 2022, 15:34

Solche Pipelines sind absolut normal. Insofern tust du da nichts ungewoehnliches. Welchen Aufwand das bedeutet kann ich nicht einschaetzen - der Teufel steckt wie immer im Detail. Weshalb solche Projekte eine ganze Menge Zeit verschlingen, weil es eben genau nicht 08/15 "mach mal ne Webseite zum eingeben einer Email fuer ein Topp Gewinnspiel" ist.