Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung Nächste Überarbeitung Beide Seiten der Revision | ||
tutorium_sound [2021/06/15 05:30] martin [Mel Frequency Cepstral Coefficients (MFCC)] |
tutorium_sound [2021/10/02 15:21] wolf |
||
---|---|---|---|
Zeile 2: | Zeile 2: | ||
Neben der Visualisierung durch Spektrogramme gibt es weitere Möglichkeiten, | Neben der Visualisierung durch Spektrogramme gibt es weitere Möglichkeiten, | ||
- | Es handelt sich dabei um sog. //Low Level Features// - also Kenngrößen, | + | Es handelt sich dabei um sog. //Low Level Features// - also Kenngrößen, |
====Spectral Centroid==== | ====Spectral Centroid==== | ||
- | Der spektrale Zentroid ist ein Maß für den Mittelpunkt oder Schwerpunkt (engl. centroid) eines Frequenzspektrums. Er bildet eine Dimension der Klangfarbenempfindung. Je höher der spektrale Zentroid liegt, desto heller und strahlender (engl.: bright) ist der entsprechende Klang. | + | Der spektrale Zentroid ist ein Maß für den Mittelpunkt oder Schwerpunkt (engl. centroid) eines Frequenzspektrums. Er entspricht einer wichtigen |
| | ||
Zeile 11: | Zeile 11: | ||
' | ' | ||
- | {{: | + | {{: |
Es öffnet sich ein Fenster, in dem Sie unter verschiedenen Deskriptortypen wählen können. Außerdem können Sie unter // | Es öffnet sich ein Fenster, in dem Sie unter verschiedenen Deskriptortypen wählen können. Außerdem können Sie unter // | ||
Zeile 20: | Zeile 20: | ||
(Achtung: Liegt kein Signal vor - also bei Stille innerhalb oder am Schluss einer Aufnahme - steigt der spektrale Schwerpunkt automatisch auf einen relativ hohen Mittelwert an.) | (Achtung: Liegt kein Signal vor - also bei Stille innerhalb oder am Schluss einer Aufnahme - steigt der spektrale Schwerpunkt automatisch auf einen relativ hohen Mittelwert an.) | ||
- | Was können Sie erkennen? Wie verändert sich der //Spectral Centroid// bei den unterschiedlichen Sounds der Aufnahme? | + | Was können Sie erkennen? |
+ | Wie verändert sich der Spectral Centroid bei den unterschiedlichen Sounds der Aufnahme? | ||
====Spectral Flux==== | ====Spectral Flux==== | ||
Zeile 35: | Zeile 36: | ||
====Constant Q-Spectrogram==== | ====Constant Q-Spectrogram==== | ||
- | Es gibt verschiedene Versuche, Spektraldarstellungen stärker an die menschliche Hörempfindung anzupassen. Eine Möglichkeit besteht darin, die Frequenzen (vertikale Achse) nicht //linear//, sondern logarithmisch (//Log//) einzustellen, | + | Es gibt verschiedene Versuche, Spektraldarstellungen stärker an die menschliche Hörempfindung anzupassen. Eine Möglichkeit besteht darin, die Frequenzen (vertikale Achse) nicht //linear//, sondern logarithmisch (//Log//) einzustellen, |
Bei Constant-Q-Spektrogrammen bleibt das Verhältnis der zentralen Frequenz und der Frequenzauflösung für alle ermittelten und dargestellten Frequenzbänder konstant. Auf diese Weise kann eingestellt werden, dass z.B. jedes dargestellte Frequenzband einer chromatischen Note entspricht. Dadurch wird die tonale Interpretation eines Spektrogramms stark erleichtert. | Bei Constant-Q-Spektrogrammen bleibt das Verhältnis der zentralen Frequenz und der Frequenzauflösung für alle ermittelten und dargestellten Frequenzbänder konstant. Auf diese Weise kann eingestellt werden, dass z.B. jedes dargestellte Frequenzband einer chromatischen Note entspricht. Dadurch wird die tonale Interpretation eines Spektrogramms stark erleichtert. | ||
Zeile 41: | Zeile 42: | ||
| | ||
- | Laden Sie die Audio-Datei von Ray Charles " | + | Laden Sie die Audio-Datei von Ray Charles " |
| | ||
Zeile 54: | Zeile 55: | ||
Mel Frequency Cepstral Coefficients (MFCC), (dt. Mel-Frequenz-Cepstrum-Koeffizienten) wurden zur automatischen Spracherkennung entwickelt, können aber auch auf die klanglichen Eigenschaften der Musik übertragen werden. Sie werden insbesondere für die Identifikation von Musikstücken eingesetzt. | Mel Frequency Cepstral Coefficients (MFCC), (dt. Mel-Frequenz-Cepstrum-Koeffizienten) wurden zur automatischen Spracherkennung entwickelt, können aber auch auf die klanglichen Eigenschaften der Musik übertragen werden. Sie werden insbesondere für die Identifikation von Musikstücken eingesetzt. | ||
- | MFCCs führen zu einer kompakten Darstellung der Spektraleigenschaften eines Audio-Signals, | + | MFCCs führen zu einer kompakten Darstellung der Spektraleigenschaften eines Audio-Signals, |
Das " | Das " | ||
- | Laden Sie bitte die Audio-Datei von Ray Charles | + | Laden Sie bitte die Datei Audio02.mp3 (" |
| | ||
+ | |||
+ | [[https:// | ||
Im Menufenster können sie die Zahl der Koeffizienten einstellen. Üblich sind 20 Koeffizienten, | Im Menufenster können sie die Zahl der Koeffizienten einstellen. Üblich sind 20 Koeffizienten, | ||
Zeile 67: | Zeile 70: | ||
====Vertiefung==== | ====Vertiefung==== | ||
- | Das Vamp Plugin //Aubio Spectral Descriptor// | + | Das Vamp Plugin //Aubio Spectral Descriptor// |