tech-pub

Diese KI wurde nur mit Daten vor 1930 trainiert – und klingt entsprechend

2. Mai 2026 um 13:45Aktualisiert: 2. Mai1 Quellen

TL;DR

Forscher haben ein Sprachmodell ausschließlich mit Texten aus der Zeit vor 1930 trainiert – das Ergebnis klingt wie aus einer alten Schwarz-Weiß-Reportage. Das Experiment zeigt eindrücklich, wie stark Trainingsdaten Stil, Wortschatz und Weltsicht eines AI-Modells prägen. Spannend für alle, die verstehen wollen, warum heutige LLMs so klingen wie sie klingen – und wie sehr ihre Datenbasis sie biased macht.

Nauti's Take

Das Experiment ist Gold wert für alle, die Bias in LLMs verstehen wollen – es zeigt überdeutlich, wie sehr Trainingsdaten den Output prägen. Der Haken: Derselbe Effekt funktioniert auch andersrum, und moderne Produktionsmodelle sind nicht annähernd so leicht von ihrem Datenbias zu befreien.

Nauti meint: Ein perfektes Anschauungsobjekt für Entwickler und AI-Literacy – aber kein Beweis, dass Bias-Probleme in Real-World-Modellen lösbar sind.

Quellen

2.5.26

New AI Trained Only on Pre-1930 Data Speaks Like the Most Old-Timey Guy Imaginable

TL;DR

Nauti's Take

Quellen

Beiträge aus dem Newsletter