Soundfile: Tonhöhe ändern - mit/ohne Formantanalyse
Verfasst: Mittwoch 12. März 2008, 14:55
Hallo!
Meine Frage ist nicht pythonspezifisch und insofern ein wenig off topic. Aber da Ihr hier manchmal ganz tolle Links oder Suchbegriffe zu Algorithmen oder geeignete Suchbegriffe liefert, möchte ich Euch gerne fragen.
Es gibt Computerprogramme, die die Tonhöhe von Soundfiles erhöhen oder erniedrigen können ohne dass der Sound schneller oder langsamer wird. (Viele Programme die dies anbieten (z. B. Audacity) basieren auf der "Soundtouch"-Library.) Ich glaube, dies funktioniert über eine FFT-Analyse und anschließende erneute Synthese des Sounds. Kann mir jemand sagen, wo ich mehr über dieses Vorgehen bzw. den zugrundeliegenden Algorithmus finden kann? Weniger programmiertechnisch als zum Verständnis.
Wenn man damit Stimmen erhöht klingt es oft MickeyMouse-artig. Bessere Programme können daher wohl die Grundfrequenz erhöhen ohne die Formanten zu verändern. Zitat aus dem Handbuch des kommerziellen Programms Melodyne (S. 59): "Bei Transponierungen ohne Formantenkorrektur nach oben entsteht der berüchtigte „Micky-Maus-Effekt“, der sich so ähnlich anhört wie wenn man Helium aus einem Luftballon einatmet und dann spricht... Wir haben bereits erwähnt, dass Melodyne plugin beim Transponieren der Tonhöhe die Formanten nicht mittransponiert, was maßgeblich zu dem natürlichen Klangverhalten der Transponierung beiträgt."
Das interessiert mich sehr. Weiß jemand, wie das funktioniert, wo man darüber etwas nachlesen kann, welche anderen Programme das auch können (freie und kommerzielle)?
Ich bitte dringend um Hilfe. Jede weiterführende Info ist sehr willkommen.
Vielen Dank,
Bernhard
Meine Frage ist nicht pythonspezifisch und insofern ein wenig off topic. Aber da Ihr hier manchmal ganz tolle Links oder Suchbegriffe zu Algorithmen oder geeignete Suchbegriffe liefert, möchte ich Euch gerne fragen.
Es gibt Computerprogramme, die die Tonhöhe von Soundfiles erhöhen oder erniedrigen können ohne dass der Sound schneller oder langsamer wird. (Viele Programme die dies anbieten (z. B. Audacity) basieren auf der "Soundtouch"-Library.) Ich glaube, dies funktioniert über eine FFT-Analyse und anschließende erneute Synthese des Sounds. Kann mir jemand sagen, wo ich mehr über dieses Vorgehen bzw. den zugrundeliegenden Algorithmus finden kann? Weniger programmiertechnisch als zum Verständnis.
Wenn man damit Stimmen erhöht klingt es oft MickeyMouse-artig. Bessere Programme können daher wohl die Grundfrequenz erhöhen ohne die Formanten zu verändern. Zitat aus dem Handbuch des kommerziellen Programms Melodyne (S. 59): "Bei Transponierungen ohne Formantenkorrektur nach oben entsteht der berüchtigte „Micky-Maus-Effekt“, der sich so ähnlich anhört wie wenn man Helium aus einem Luftballon einatmet und dann spricht... Wir haben bereits erwähnt, dass Melodyne plugin beim Transponieren der Tonhöhe die Formanten nicht mittransponiert, was maßgeblich zu dem natürlichen Klangverhalten der Transponierung beiträgt."
Das interessiert mich sehr. Weiß jemand, wie das funktioniert, wo man darüber etwas nachlesen kann, welche anderen Programme das auch können (freie und kommerzielle)?
Ich bitte dringend um Hilfe. Jede weiterführende Info ist sehr willkommen.
Vielen Dank,
Bernhard