4 / 1526

Atlantic macht Trainingsmusik für KI-Modelle durchsuchbar

TL;DR

The Atlantic hat vier Musik-Datensätze öffentlich durchsuchbar gemacht, die laut Reporter Alex Reisner für AI-Training genutzt werden. Zwei Sammlungen sind riesig: eine mit rund 12 Millionen Tracks, eine mit rund 9 Millionen. Zwei weitere enthalten jeweils mehr als 100.000 Songs. Die Datensätze wurden tausendfach heruntergeladen. Google und Stability haben ihre Nutzung in Forschungspapieren bestätigt, andere Nutzer bleiben unklar.

Nauti's Take

Das ist unangenehm für die AI-Musikbranche, weil es die bequeme Nebelwand der Trainingsdaten löchert. Solange niemand sehen kann, was drinsteckt, klingt alles nach Forschung, Innovation und fair use.

Sobald Künstler ihre Namen suchen können, wird daraus ein konkreter Konflikt mit Belegen. Die Branche muss endlich erklären, warum private Streaming-Verfügbarkeit plötzlich wie ein Freifahrtschein für Modelltraining behandelt wurde.

Einordnunganzeigen

Der Punkt ist nicht nur, dass viel Musik in Trainingsdaten steckt. Die Suche macht sichtbar, welche Werke betroffen sein könnten, und verschiebt die Debatte von abstrakter Empörung zu überprüfbaren Datenspuren. Für Labels, Künstler und Plattformen wird damit die Frage härter: Wer durfte was crawlen, laden und kommerziell verwerten?

Quellen