Aufwandseinschätzung Kombination mehrerer KI-Algorithmen
Verfasst: Mittwoch 30. März 2022, 15:04
Hi!
ich nutze einen Instanzsegmentationsalgorithmus zur Erkennung von Objekten auf Bildern. Kurze Erklärung (so weit ich es richtig verstanden habe): Objekterkennungsalgorithmen geben einen rechteckigen Bereich innerhalb eines Bilder, wo ein Objekt erkannt wurde, also eine Bounding Box um das Objekt. Instanzsegmentierungsalgorithmen können aufs Pixel genau ein erkanntes Objekt erkennen und über eine Maske wiedergeben.
Ich nutze folgenden Algorithmus:
https://github.com/matterport/Mask_RCNN
Die Ergebnisse sind...okay. Ich erreiche durch Objekterkennungsalgorithmen wie YOLO bessere Bounding Boxes (nur kann dieser eben nicht das erkannte Objekt aufs Pixel genau einzeichnen).
Meine Idee war nun folgende: YOLO für die Detektion von Bounding Boxes zu nehmen, und diese Informationen zu nutzen, um den MRCNN-Algorithmus dann innerhalb dieses Rechtecks suchen zu lassen.
Sprich: Dem MRCNN vordefinierte Regions of Interests zu geben (die aus der YOLO-Erkennung kommen).
Kann jemand seine Gedanken zu meiner Idee sagen? Ergibt das Sinn oder übersehe ich irgendwas? Kann hier jemand ungefähr den Aufwand dafür abschätzen?
Beste Grüße
ich nutze einen Instanzsegmentationsalgorithmus zur Erkennung von Objekten auf Bildern. Kurze Erklärung (so weit ich es richtig verstanden habe): Objekterkennungsalgorithmen geben einen rechteckigen Bereich innerhalb eines Bilder, wo ein Objekt erkannt wurde, also eine Bounding Box um das Objekt. Instanzsegmentierungsalgorithmen können aufs Pixel genau ein erkanntes Objekt erkennen und über eine Maske wiedergeben.
Ich nutze folgenden Algorithmus:
https://github.com/matterport/Mask_RCNN
Die Ergebnisse sind...okay. Ich erreiche durch Objekterkennungsalgorithmen wie YOLO bessere Bounding Boxes (nur kann dieser eben nicht das erkannte Objekt aufs Pixel genau einzeichnen).
Meine Idee war nun folgende: YOLO für die Detektion von Bounding Boxes zu nehmen, und diese Informationen zu nutzen, um den MRCNN-Algorithmus dann innerhalb dieses Rechtecks suchen zu lassen.
Sprich: Dem MRCNN vordefinierte Regions of Interests zu geben (die aus der YOLO-Erkennung kommen).
Kann jemand seine Gedanken zu meiner Idee sagen? Ergibt das Sinn oder übersehe ich irgendwas? Kann hier jemand ungefähr den Aufwand dafür abschätzen?
Beste Grüße