tech-pub

The Atlantic legt offen, welche Musik in KI-Trainingsdaten steckt

20. Juni 2026 um 18:46Aktualisiert: 22. Juni1 Quellen

TL;DR

Atlantic-Reporter Alex Reisner hat vier Musik-Datensätze gefunden, die für AI-Training genutzt werden, und sie öffentlich durchsuchbar gemacht. Zwei Datensätze sind riesig: rund 12 Millionen und 9 Millionen Tracks. Zwei weitere enthalten jeweils mehr als 100.000 Songs. Die Sets wurden laut Reisner tausendfach heruntergeladen. Google und Stability haben ihre Nutzung in Forschungsarbeiten bestätigt, andere Nutzer bleiben unklar.

Nauti's Take

Das ist der Moment, in dem Musiktraining aus der Nebelmaschine gezogen wird. Für KI-Builder reicht es nicht mehr, auf irgendein Dataset mit nettem README zu zeigen.

Wenn Links zu Spotify oder YouTube die Lizenzbasis sind, baust du nicht auf Daten, sondern auf einer späteren Klageerwiderung.

Einordnunganzeigen

Der Fall zeigt, wie wenig transparent Musik-Training bislang läuft. Selbst wenn Datensätze öffentlich im Netz liegen, heißt das nicht automatisch, dass Rechte, Plattformbedingungen und kommerzielle Nutzung sauber geklärt sind. Für Musiker wird damit sichtbar, ob ihre Werke im Trainingsmaterial auftauchen könnten.

Quellen

20.6.26

The Atlantic created a searchable database of the music used to train AI

#google

TL;DR

Nauti's Take

Quellen

Ähnliche Stories

Beiträge aus dem Newsletter