Spektrogramm

Dieses interaktive Spektrogramm wurde mit JavaScript geschrieben und sollte die akustischen Bestandteile der menschlichen Stimme fassbar machen. Optimiert ist es für Maus und Tastatur, funktioniert aber auch auf mobilen Geräten.






Dies ist ein Spektrogramm einer menschlichen Sprachaufnahme, die in ihre akustischen Teile zerlegt wurde. Die y-Achse stellt die Frequenz (also Tonhöhe) dar, was bedeutet, dass tiefere (bassige) Teile des Klangs unten sind, während höhere Teile oben sind.

Drücken Sie die Leertaste, um die Wiedergabe zu starten oder zu pausieren, und klicken Sie auf das Bild, um verschiedene Teile zu (de)aktivieren. Somit können Sie hören, wie jeder Teil zum Gesamtklang beiträgt.

Weitere Informationen

Die horizontalen Linien sind die harmonischen Partialtöne. Jede Linie repräsentiert einen „reinen“ Sinuston. Zusammen bilden sie die Vokale (sowie einige Konsonanten wie m und l). Wenn die Frequenz des Grundtons bei etwa 100 Hz liegt (was etwa einem G♯2 entspricht), ist der erste Oberton immer doppelt so hoch, also etwa 200 Hz, der zweite Oberton liegt bei etwa 300 Hz, der dritte bei etwa 400 Hz und so weiter.

Was einen Vokal von einem anderen unterscheidet, ist die Betonung bestimmter Obertöne – Sie können im Bild sehen, dass manchmal Obertöne auf einer bestimmten Höhe lauter sind als andere. Deshalb werden die Vokale auch immer deutlicher, je mehr Obertöne Sie dazuschalten.

Die Teile des Bildes, die verschwommener erscheinen, sind die inharmonischen Teile des Klangs. Diese machen den Großteil der Konsonanten aus, einschließlich Frikativen (wie s, f, th, v) und Plosiven (wie c, b, g, t). Diese Teile bestehen aus klanglosem Rauschen, anstatt aus reinen Sinustönen.