Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

--- tutorium_sound [2021/09/08 10:35]
martin [Mel Frequency Cepstral Coefficients (MFCC)]
+++ tutorium_sound [2022/02/22 10:37] (aktuell)
martin [Weitere Messgrößen]
@@ Zeile 11: / Zeile 11: @@
    'Transform' - 'Analysis by maker' - 'Paul Brossier' - 'Aubio Spectral Descriptor'
-{{:spectral_centroid.png?150 |}}
+{{:spectral_centroid.png?200 |}}<WRAP clear></WRAP>
 Es öffnet sich ein Fenster, in dem Sie unter verschiedenen Deskriptortypen wählen können. Außerdem können Sie unter //Advanced// die Größe der Analysefenster (//Audio frames per block//) und deren Überlappung (//Windows increment//) einstellen.
@@ Zeile 36: / Zeile 36: @@
 ====Constant Q-Spectrogram====
-Es gibt verschiedene Versuche, Spektraldarstellungen stärker an die menschliche Hörempfindung anzupassen. Eine Möglichkeit besteht darin, die Frequenzen (vertikale Achse) nicht //linear//, sondern logarithmisch (//Log//) einzustellen, da unsere Hörempfindung sich an Verhältnissen von 2er-Logarithmen orientiert, d.h. die jeweils doppelte Frequenz (= Oktavabstand) wird als doppelt so hoch empfunden.
+Es gibt verschiedene Versuche, Spektraldarstellungen stärker an die menschliche Hörempfindung anzupassen. Eine Möglichkeit besteht darin, die Frequenzen (vertikale Achse) nicht //linear//, sondern logarithmisch (//Log//) einzustellen, da unsere Hörempfindung sich an 2er-Logarithmen orientiert, d.h. die jeweils doppelte Frequenz wird als doppelt so hoch (= Oktavabstand) empfunden, die vierfache Frequenz als dreimal so hoch, die achtfache als viermal so hoch.
 Bei Constant-Q-Spektrogrammen bleibt das Verhältnis der zentralen Frequenz und der Frequenzauflösung für alle ermittelten und dargestellten Frequenzbänder konstant. Auf diese Weise kann eingestellt werden, dass z.B. jedes dargestellte Frequenzband einer chromatischen Note entspricht. Dadurch wird die tonale Interpretation eines Spektrogramms stark erleichtert.  \\
@@ Zeile 42: / Zeile 42: @@
    Starten Sie den Sonic Visualiser.
-   Laden Sie die Audio-Datei von Ray Charles "Comeback Baby".
+   Laden Sie die Audio-Datei von Ray Charles "Comeback Baby" (Audio01.mp3).
    Wählen Sie im Menupunkt 'Transform' - 'Analysis by maker' - 'Queen Mary, University of London' - 'Constant Q Spectrogram'.
@@ Zeile 61: / Zeile 61: @@
    Laden Sie bitte die Datei Audio02.mp3 ("Comeback Baby" von Ray Charles).
    Wählen Sie im Menupunkt 'Transform' - 'Analysis by maker' - 'Queen Mary, University of London' - 'Mel Frequency Cepstral Coefficients'
+[[https://analyse.hfm-weimar.de/lib/exe/fetch.php?media=come_back_baby.mp3|Audio02.mp3]]
 Im Menufenster können sie die Zahl der Koeffizienten einstellen. Üblich sind 20 Koeffizienten, es kann aber auch eine feiner Auflösung eingestellt werden.
+====Weitere Messgrößen====
+Mit den Vamp Plugins lassen sich weitere Messgrößen bestimmen, die mit dem Sound und dem klanglichen Eindruck eines Audio-Signals in Zusammenhang stehen. Hier die wichgsten Messgrößen in alphabetischer Reihenfolge:
+  * **Harmonic Ratio**: Proportionaler Anteil von harmonischen Komponenten in einem Signal.
+  *
+  * **Signal to Noise Ratio (SNR)**: Verhältnis von Signal zum (Hintergrunds-)Rauschen.
+  *
+  * **Spectral Crest**: Verhältnis vom Maximalwert einer Spektralverteilung zum arithmetischen Mittel; Indikator für den Grad der Tonalität eines Signals.
+  *
+  * **Spectral Entropy**: Maß der Geordnetheit, Einheitlichkeit und Redundanz eines Signals. Weißes Rauschen besitzt eine geringe Uniformität und daher einen hohen Entropiewert.
+  *
+  * **Spectral Flatness**: Weiteres Maß für die Einheitlichkeit (vgl. Spectral Entropy).
+  *
+  * **Spectral Roll-Off-Point**: Der //Roll-Off-Point// ist jene Frequenz, unter der 85% der Energie eines Signals liegen.
+  *
+  * **Spectral Skewness**: Maß für die Symmetrie eines Spektrums um den Mittelwert (Median); ein hoher Wert impliziert eine Neigung (//skewness//) zu hohen Frequenzanteilen, ein niedriger Wert eine Neigung zu tiefen Frequenzanteilen.
+  *
+  * **Spectral Slope**: Ein Maß für den Energieabfall im hohen Frequenzbereich; bietet Hinweise auf die Farbe von Rauschen oder die Dominanz (hoher) Teiltöne im Spektrum.
+  *
+  * **Spectral Spread**: Maß für den Grad der Streuung eines Spektrums um den [[tutorium_sound#spectral_centroid|spektralen Zentroiden]]; dient der Unterscheidung zwischen periodischen Signalen und Rauschen.
+  *
+  * **Zero Crossing Rate**: Rate der Nulldurchgänge pro Zeit; eine hohe Rate weist auf ein geräuschhaftes Signal bzw. Rauschen hin.
 ====Vertiefung====
-Das Vamp Plugin //Aubio Spectral Descriptor// bietet weitere spektrale Deskriptoren zur Auswahl an. Testen Sie diese an Audio.mp3 und an ausgewählten eigenen Musikbeispielen.
+Das Vamp Plugin //Aubio Spectral Descriptor// bietet viele spektrale Deskriptoren zur Auswahl an. Testen Sie diese an //Audio02.mp3// und an ausgewählten eigenen Musikbeispielen.