Meine Idee:
Ich würde gerne die Sprechzeit der Gäste eines Podcasts herausfinden. Der Podcast besteht aus zwei Personen die mit Hilfe von zwei Kameras gefilmt werden. Spricht einer der Gäste wird die jeweilige Kamera die auf die sprechende Person fällt benutzt. Der Hintergrund der beiden Personen ist unterschiedlich. Nun würde ich gerne herausfinden wie viel Sprechzeit jede einzelne Person hat indem das Programm sich einen kleinen Bereich im Hintergrund der sprechenden Person sich anschaut und den Durchschnitt bildet. Damit würde das Programm jeden Frame analysieren und man hätte Daten über die Zeit in der eine Kameraposition und damit automatisch auch in der der jeweilige Gast gesprochen hat.
Nun weiß ich weder ob das ganze so überhaupt umsetzbar ist geschweige denn in Python. Vielleicht gibt es auch schon so was ähnliches.
Mein Ziel wäre es gleich mehrere Videos durch das Programm automatisch analysieren zu lassen.
Danke im Voraus
