Wie KI die viralen Hits von morgen schreiben könnte
Im Rahmen des Wahlpflichtmoduls Forschungsprojekt: Text Analytics bei Prof. Dr. Michael Schulz haben wir: Nicolas Poslednik, Jasper Scheel, Jan-Ole Stahl und Paul Burmeister uns mit der Frage beschäftigt, ob generative künstliche Intelligenzen in der Lage sind, qualitative Songtexte zu schreiben. In diesem Artikel geben wir einen Einblick in unsere Forschungsarbeit und die daraus gewonnenen Erkenntnisse.
19.000 deutsche Chartplatzierungen als Grundlage der Musikforschung
Die Grundlage für diese Analyse war eine Datenbank über die deutschen Musik-Charts seit den 1980er Jahren. Diese Datenbasis enthielt Titel, Interpreten, Dauer der Chartplatzierung sowie den Songtext des jeweiligen Liedes. Nachdem aus dieser Datenbank alle englischsprachigen Songs entfernt wurden, haben wir mit der Analyse dieser Daten begonnen.
Mustererkennung in den Jahrzehnten
Zunächst haben wir ein Scoring-Verfahren entwickelt, um die einzelnen Wörter der Songs bewerten zu können. Dabei wurde sowohl die Chartplatzierung als auch die Dauer der Platzierung eines Liedes betrachtet. Anschließend wurden die Texte in einzelne Wörter, so genannte Tokens, unterteilt und Stoppwörter entfernt. Dabei handelt sich um Wörter ohne Bedeutung wie: ist, durch oder das. Um die verbleibenden Tokens zu vergleichen, wurde jedem Wort der Score des Songs zugeordnet, in dem dieses Wort enthalten war. Kam ein Wort in mehreren Songs vor, wurden die jeweiligen Scores dieser Songs auf das Token addiert. So erhält man einen Gesamtscore für jedes Token.
Anschließend wurden die Tokens mittels einer relativen Methode den Jahrzehnten seit den 80er-Jahren zugeordnet. Dabei haben wir diese Zuordnungen so gefiltert, dass nur Tokens berücksichtigt werden, welche eine Zugehörigkeit zu einem Jahrzehnt von über 27% besitzen.
Schreiben eines Songtextes mit ChatGPT-4
Abschließend wurde mittels ChatGPT-4 ein jahrzehnteübergreifender Liedtext geschrieben. Jede Strophe repräsentiert dabei ein Jahrzehnt. Hierfür wurden die 50 wichtigsten Wörter je Dekade übergeben. Die Ergebnisse sind in den folgenden Abbildungen zu erkennen.
Fett markierte Wörter wurden als Parameter mitgegeben
Was bedeuten diese Ergebnisse für die Zukunft der Musikproduktion?
Die Resultate zeigen, dass es grundsätzlich möglich ist, mithilfe vorhandener KI-Modelle Songtexte zu generieren. Dabei ist zu beachten, dass diese Texte auf Mustern basieren, die durch das Training der KI entstehen. Die Qualität der Liedtexte hängt daher stark von der Qualität des Trainingsdatensatzes ab. Es ist denkbar, dass mit dem richtigen Training auch feine Nuancen von Emotionen in den Texten eingefangen werden könnten.
Letztlich bleibt jedoch zu sagen, dass die Wahrnehmung von Musik stets subjektiv ist und einem kontinuierlichen Wandel unterliegt. Somit wird ein KI-generierter Song nicht automatisch zu einem Charterfolg.