Tutorial Advanced Noten Part 3: Korpus-Statistik

(version 2022_01_24)

Dieses Tutorial führt in die computergestützten Möglichkeiten einfacher statistischer Abfragen auf der Grundlage von CAMAT (Computer-Assisted Music Analysis Tool) ein, wobei nun, anders als in Part 2, vergleichende Abfragen mehrere Stücke durchgeführt werden. Abgefragt werden

Das Durcharbeiten und Nachvollziehen des Tutoriums soll es Ihnen ermöglichen, mit den vorgestellten computergestützten Methoden eigene Musikbeispiele (Notendateien) zu untersuchen und Vergleiche zwischen verschiedenen Musikstücken durchzuführen.

Zu Beginn steht wieder das Laden verschiedener Bibliotheken mit folgenden Befehlen:

Im Statistik-Tutorial (Part 2) haben wir uns den ersten Satz aus dem Streichquartett KV. 171 von Wolfgang Amadeus Mozart angeschaut. Nun wollen wir die vier Sätze des Streichquartetts miteinander vergleichen.

Hier die URL's der vier Dateien:

Wir könnendie vier Dateien mit dem folgenden Befehl unter der gemeinsamen Bezeichnung 'xml_files' laden:

Mit dem folgenden Befehl ('df = mp.core.corpus.analyse_interval') wird eine Tabelle (oder 'Dataframe' mit der Bezeichnung 'df') erzeugt, die sich anschließend durch den Befehl 'df' im Browser als Tabelle anzeigen lässt oder durch den Befehl 'df.to_csv' als csv-Datei speichern lässt.

Die Berechnung kann - je nach Anzahl und Größe der Dateien - einige Sekunden bis mehrere Minuten dauern...

Zuvor können eine Reihe von Parametern eingestellt werden.

Folgende Parameter können verändert werden:

= Name der geladenen Notendateien (s. oben)

Durch diesen Parameter werden die einzelnen Stimmen isoliert. (Die Angabe 'False' ist hier nicht möglich.)

Für alle Stimmen werden die statistischen Angaben dargestellt.

Für alle Stimmen wird eine Verteilung der Tonhöhenklassen angeszeigt. (Von 0=C bis 11=B (H).) Wenn dies nicht gewünscht wird, bitte 'include_pitchclass=False' wählen!

Mit diesem Parameter kann man einstellen, welche Intervallfortschreitungen dargestellt werden. Mi [-6, 6] werden z.B. Quinte abwärts (- 6 Halbtöne) bis Quinte aufwärts (+ 6 Halbtöne) dargestellt; alle größeren Intervalle kommen in zwei gemeinsame Restklassen (<6 bzw. >6). Bei 'None' werden alle Intervalle, die auftreten, dargestellt.

Durch diesen Parameter werden alle Intervalle, die auftreten, dargestellt.

Hierdurch lässt sich zwischen absoluten Häufigkeiten (also der Anzahl der auftretenden Tonhöhenklassen bzw. Intervalle) bei 'False' und relativen Häufigkeiten (also prozentualer Anteil) bei 'True' umschalten.

Wenn Sie alle Parameter eingestellt haben, aktivieren Sie bitte den folgenden einfachen Befehl 'df', durch den die Tabelle dargestellt wird ('Run').

Vergleichen Sie bitte die Häufigkeit der Tonhöhenklassen für verschiedene Sätze und Stimmen. Wählen Sie zur einfacheren Auswertung auch den relativen Anteil in Prozentwerten (get_in_percentage=True). Wie diatonisch bzw. chromatisch sind die einzelnen Sätze und Stimmen gestaltet?

Was lässt sich zu den Intervallfortschreitungen in den einzelnen Stimmen sagen? Welche Stimme hat die meisten bzw. die größten Sprünge? Bei welcher Stimme dominieren die (kleinen) Intervallschritte?

Mit dem folgenden Befehl wird die Tabelle als csv-Datei gespeichert.

Bitte zunächst einen lokalen Pfadnamen sowie den Dateinamen eingeben, dann # löschen und 'Run'!

Bitte variieren Sie bei erneuten Abfragen die Variable für die Tabelle, z.B. 'df2' statt 'df'. Hier das Beispiel einer Abfrage der Intervalle bis zu 12 Halbtönen, also einer Oktave (aufwärts und abwärts) in Prozenten. Die allgemeinen Tonhöhen und Tonhöhenklassen interessieren nun nicht mehr, daher: 'include_basic_stats=False' und 'include_pitchclass=False'.

Wie unterscheiden sich die einzelnen Sätze (und Stimmen) hinsichtlich der auftretenden Intervalle? Welche Intervalle treten häufig auf - welche (fast) nie?

Und nun viel Spaß bei der vergleichenden Untersuchung der Verteilung von Tonhöhenklassen und Intervallfortschreitungen zwischen Kompositionen Ihrer Wahl!!