Copilot tippt vier WM-Spiele daneben und zeigt die Grenzen von KI-Prognosen
TL;DR
USA Today ließ Microsoft Copilot vier WM-Spiele tippen. Das Modell setzte auf klare Sieger: Spanien gegen Cabo Verde 3:0, Belgien gegen Ägypten 2:1, Uruguay gegen Saudi-Arabien 2:1 und Iran gegen Neuseeland 1:0. Alle vier Tipps lagen daneben. Jedes Spiel endete unentschieden: Spanien gegen Cabo Verde 0:0, Belgien gegen Ägypten 1:1, Uruguay gegen Saudi-Arabien 1:1 und Iran gegen Neuseeland 2:2.
Nauti's Take
Das ist kein Beweis, dass AI im Sport nutzlos ist. Für Datenrecherche, Szenarien und Vorberichte kann sie helfen.
Aber Ergebnistipps sind die falsche Bühne für generative Modelle, solange sie Wahrscheinlichkeiten nicht sauber kalibrieren und Quellenhype von Signal trennen. Wer daraus Wett- oder Geschäftsentscheidungen baut, verwechselt Sprachgewandtheit mit Urteilskraft.
Einordnunganzeigen
Der Fall ist klein, aber sauber als Warnsignal: Ein Chatbot kann plausibel klingen und trotzdem die einfachste Ergebnisstruktur verfehlen. Für Sportwetten, Live-Berichterstattung oder Fan-Content reicht Sprachgewandtheit nicht. Wer LLMs für Prognosen nutzt, braucht echte Datenmodelle, Kalibrierung und klare Unsicherheiten, sonst recycelt das System nur Erzählungen aus dem Netz.