tech-pub

Forscher warnen: KI auf KI-Daten zu trainieren riskiert Model Collapse

13. März 2026 um 13:19Aktualisiert: 14. März1 Quellen

TL;DR

Forscher warnen: Wenn KI-Modelle zunehmend auf KI-generierten Daten trainiert werden, droht ein sogenannter 'Model Collapse' – eine schleichende Qualitätsdegradation der Ausgaben.

Key Points

Plattformen wie Stack Overflow und Chegg, die früher als Hauptquellen für menschliches Wissen dienten, verlieren massiv an Nutzern – Stack Overflow verzeichnet einen Rückgang von 78%.
Das Problem: Das Web füllt sich mit synthetischen Inhalten, die wiederum als Trainingsdaten dienen – ein Rückkopplungskreislauf, der Fehler und Homogenität verstärkt.
Ohne ausreichend frische, menschlich generierte Daten riskieren zukünftige Modelle, immer ungenauere und einseitigere Outputs zu produzieren.

Nauti's Take

Das ist das KI-Äquivalent von genetischer Inzucht – und genauso problematisch. Wer glaubt, synthetische Daten könnten menschliches Wissen dauerhaft ersetzen, hat das Grundprinzip von Lernen nicht verstanden.

Besonders bitter: Plattformen wie Stack Overflow waren jahrzehntelang das Rückgrat der Entwickler-Community – und sterben jetzt an dem Werkzeug, das sie mitgefinanziert haben. Die Branche braucht dringend Mechanismen, um menschlich erzeugte Inhalte zu erhalten und zu kennzeichnen, bevor der Rückkopplungskreislauf irreversibel wird.

Hintergrund

Model Collapse ist kein theoretisches Szenario mehr – er passiert gerade, während das Web mit KI-Content geflutet wird. Die Ironie: Je mehr KI-Systeme eingesetzt werden, um Inhalte zu produzieren, desto schlechter wird die Datenbasis für die nächste Modellgeneration. Menschliche Wissensplattformen, die jetzt sterben, sind nicht ersetzbar – ihr Verlust hinterlässt eine dauerhafte Lücke in der Trainingsdatenbasis.

Das betrifft nicht nur Qualität, sondern auch Vielfalt, Kreativität und die Fähigkeit von Modellen, echte Neuerungen zu erkennen.

Video

Quellen

13.3.26

Researchers Warn AI Training on AI Data Drives Model Collapse