Objekterkennung mit Video trainieren?
Verfasst: Freitag 8. Mai 2020, 22:51
Hallo Zusammen,
Ich habe letztens ein Beispiel gesehen in welchem eine Objekterkennung über die Webcam mit Java Script trainiert wurde.
Das Programm funktionierte so, dass bei gedrückter T Taste das Modell trainiert und mit einem bestimmten Begriff verknüpft wurde.
Also man drückt die Taste und lächelt zb. Je länger man dies tut, desto besser wird das Modell trainiert.
Ist man damit fertig wird und die Taste "e" gedrückt gehalten, um in den Erkennungsmodus zu kommen.
Lächelt man nun, wird dies erkannt und das Wort Lächeln angezeigt.
Kann man genauso ein Beispiel auch mit Python realisieren?
Denn 99% der Beispiel im Internet zeigen immer nur, wie man einen furniertes Modell benutzt, dass dann alle möglichen standardobjekte erkennen kann. Aber was interessiert mich das, ob ich jetzt eine Tomate in die Kamera halte, oder eine Schere oder einen Teller? Damit kann man doch nichts sinnvolles programmieren oder?
Die anderen Beispiele waren so, dass Fotos in einem Ordner zum trainieren genommen werden, aber ich möchte ja keine 1000 Fotos machen und dann per irgendwo hin Kopieren?
Sondern ich möchte zb ein Objekt das nur ich kenne zb Omas Ohringe in die Kamera halten oder zb einen neuen Prototypen in der Produktion mit einem bestimmten Namen.
Das System lernt dies und kann mit dann um genau sagen um welche Prototypen es sich handelt und nicht nur den Oberbegriff.
Leider finde ich dazu nirgendwo ein Beispiel, was irgendwie erstaunlich ist, weil sowas mit ein paar Zeilen Java Script möglich ist, mit Python aber schreinbar nicht.
Ich hoffe jemand kann mir diesbezüglich ein big picture geben.
Danke im vorraus!
Peach
Ich habe letztens ein Beispiel gesehen in welchem eine Objekterkennung über die Webcam mit Java Script trainiert wurde.
Das Programm funktionierte so, dass bei gedrückter T Taste das Modell trainiert und mit einem bestimmten Begriff verknüpft wurde.
Also man drückt die Taste und lächelt zb. Je länger man dies tut, desto besser wird das Modell trainiert.
Ist man damit fertig wird und die Taste "e" gedrückt gehalten, um in den Erkennungsmodus zu kommen.
Lächelt man nun, wird dies erkannt und das Wort Lächeln angezeigt.
Kann man genauso ein Beispiel auch mit Python realisieren?
Denn 99% der Beispiel im Internet zeigen immer nur, wie man einen furniertes Modell benutzt, dass dann alle möglichen standardobjekte erkennen kann. Aber was interessiert mich das, ob ich jetzt eine Tomate in die Kamera halte, oder eine Schere oder einen Teller? Damit kann man doch nichts sinnvolles programmieren oder?
Die anderen Beispiele waren so, dass Fotos in einem Ordner zum trainieren genommen werden, aber ich möchte ja keine 1000 Fotos machen und dann per irgendwo hin Kopieren?
Sondern ich möchte zb ein Objekt das nur ich kenne zb Omas Ohringe in die Kamera halten oder zb einen neuen Prototypen in der Produktion mit einem bestimmten Namen.
Das System lernt dies und kann mit dann um genau sagen um welche Prototypen es sich handelt und nicht nur den Oberbegriff.
Leider finde ich dazu nirgendwo ein Beispiel, was irgendwie erstaunlich ist, weil sowas mit ein paar Zeilen Java Script möglich ist, mit Python aber schreinbar nicht.
Ich hoffe jemand kann mir diesbezüglich ein big picture geben.
Danke im vorraus!
Peach