Donnerstag 25. Januar 2007, 16:24
> Wie man Spektrogramme wieder zurück in wav-Dateien wandeln kann
Hola,
um eventuelle Mitlesende auf den gleichen Stand zu bringen, darf ich kurz erklären, was ein Spektrogramm ist. Es handelt sich um ein Diagramm, dass die Frequenzverteilung in einem Soundfile, typischerweise wird es im Umfeld der Untersuchung menschlicher Sprache angewendet, darstellt. Dazu wird in einem rechtwinkligen Koordinatensystem die Zeit nach rechts abgetragen. Die Frequenzen werden nach oben abgetragen und je stärker eine Frequenz zu einem gegebenen Zeitpunkt vorhanden ist, umso schwärzer wird das zugehörige Pixel.
Standardisiert ist wenig: Die Skala auf der Zeitachse wird je nach Bedarf gestreckt oder gestaucht, abhängig vom gerade untersuchten Zeitfenster. Der Frequenzumfang orientiert sich natürlich am menschlichen Gehör. Frequenzen um 100Hz müssen gut von Null abgrenzbar sein, weil da bei Männerstimmen der Grundton liegt. Die Intensität wird üblicherweise als Grauwert, gerne aber auch als Farbwert aufgetragen. Hier besteht keine Normierung, welcher Grauwert welcher Intensität entspricht, im Gegenteil, man passt es je nach gewünschtem Dynamikumfang an.
Normiert ist lediglich, dass man zwischen zwei Einstellungen der "Analysis bandwidth" unterscheidet: "Wideband (300Hz)" und "Narrowband (45Hz)". Ich denke, es geht darum, wie groß die Musikschnipsel sind, auf die die FFT jeweils angewendet wird.
Ich vermute, dass beim Erstellen eines Spektrogramms insgesamt reichlich Information verloren geht, so dass eine Umkehrung in ein Soundfile sehr verlustbehaftet wäre.
Gruß,
Bernhard