17 / 1510

Microsoft Copilot tippt vier WM-Spiele und liegt viermal daneben

TL;DR

USA Today ließ Microsoft Copilot vier World-Cup-Partien vom Montag tippen: Spanien gegen Cape Verde 3:0, Belgien gegen Ägypten 2:1, Uruguay gegen Saudi-Arabien 2:1 und Iran gegen Neuseeland 1:0. Alle vier Tipps lagen daneben. Tatsächlich endeten alle Spiele unentschieden: Spanien-Cape Verde 0:0, Belgien-Ägypten 1:1, Uruguay-Saudi-Arabien 1:1 und Iran-Neuseeland 2:2.

Nauti's Take

Copilot hat eine Sportwette verloren und einen Realitätscheck geliefert. Der Fehler ist weniger das falsche Ergebnis als die Sicherheit der Erzählung darum herum: Spanien wirkt stärker, also schreibt das Modell eine Geschichte, in der Spanien gewinnt.

Genau so schleichen sich LLMs in Entscheidungsprozesse ein. Erst klingt es wie Analyse, dann wie Gewissheit, und irgendwann nennt jemand das Forecasting.

Einordnunganzeigen

Der Fall zeigt sauber, wo LLMs gefährlich überzeugend werden: Sie liefern eine stimmige Begründung, auch wenn die Vorhersage wackelt. Für Sportwetten ist das offensichtlich riskant, aber die größere Lehre gilt für Business-Prognosen, Märkte und Operations: Sprachmodelle simulieren Analyse, sie ersetzen keine belastbare Modellierung mit kalibrierten Wahrscheinlichkeiten.

Quellen