The Atlantic macht Trainingsmusik für KI durchsuchbar
TL;DR
The Atlantic-Reporter Alex Reisner hat vier Musik-Datensätze gefunden, die in der AI-Entwicklung kursieren, und sie öffentlich durchsuchbar gemacht: zwei riesige Sets mit 12 Millionen und 9 Millionen Tracks sowie zwei kleinere mit jeweils über 100.000 Songs. Google und Stability haben in Research-Papers bestätigt, mindestens Teile solcher Daten genutzt zu haben. Wer die anderen Sets verwendet hat, bleibt wegen der üblichen Geheimhaltung bei Trainingsdaten offen.
Nauti's Take
Die Datenbank ist unangenehm für die AI-Musikbranche, weil sie das bequemste Narrativ zerstört: Es geht nicht um magisches Lernen aus Kultur, sondern um sehr konkrete Dateien, Links und Rechteketten. Wer AI-Musik verkauft, muss irgendwann erklären, welche Musik in der Maschine steckt und warum die Urheber daran nicht beteiligt werden.
Transparenz ist hier kein PR-Bonus, sondern die Mindestbasis für einen fairen Markt.
Einordnunganzeigen
Die Datenbank macht sichtbar, was in AI-Musikmodellen oft abstrakt bleibt: konkrete Songs, Künstler und Rechteketten. Für Musiker wird damit prüfbar, ob ihre Werke in Trainingsquellen auftauchen. Für AI-Firmen steigt der Druck, Herkunft, Lizenzstatus und kommerzielle Nutzung sauberer zu erklären.