Bestimmtes variables Objekt aus einem Bild extrahieren

mit matplotlib, NumPy, pandas, SciPy, SymPy und weiteren mathematischen Programmbibliotheken.
Antworten
ShunYagami
User
Beiträge: 2
Registriert: Donnerstag 20. Juli 2023, 16:58

Hi zusammen,

Ich versuche eine Software zu schreiben, welche das Ziel hat, einem Greifer Informationen über seine Position zu geben.
Ich schaue von oben mit dem Greifer auf eine Getrankekiste drauf und möchte den Greifer genau mittig über der Kiste positionieren. Dafür müsste ich die Kiste auf dem bild genau erkennen. Also wo befindet sich die Kiste auf dem Bild und in welchem Winkel steht sie.
Habt ihr eine Idee, wie ich die Kiste aus dem Bild extrahieren könnte? Das große Problem dabei ist, dass sämtliche Kisten unterschiedlich aussehen und zum Beispiel andere Farben besitzen.

Mit freundlichen
ShunYagami
__deets__
User
Beiträge: 14543
Registriert: Mittwoch 14. Oktober 2015, 14:29

Wie bei allen CV-Fragen kann man ohne konkrete Bilder wenig sagen. Für einen vorbildlichen Post diesbezüglich ziehe zb viewtopic.php?t=57116
ShunYagami
User
Beiträge: 2
Registriert: Donnerstag 20. Juli 2023, 16:58

Hier ein Beispielbild https://drive.google.com/file/d/1YLSDhw ... sp=sharing
Das ziel ist es ein Bild zu erhalten, auf dem die Kontur schwarzen Kiste (oder im allgemeinen der größten gefundenen Kiste) zu sehen ist. Sodass ich die Größe und Rotation der Kiste bestimmen kann.
__deets__
User
Beiträge: 14543
Registriert: Mittwoch 14. Oktober 2015, 14:29

Na das ist natuerlich so kompliziert, wie die Aufgabe nur irgend geht.

Ich wuerde es wahrscheinlich mit einem CNN und Transferlearning angehen. Das reduziert die Menge der benoetigten Trainingsdaten signifikant. Siehe zB https://pytorch.org/tutorials/beginner/ ... orial.html
Antworten