ChatGPT vs Claude: So vergessen Bots deine eigentliche Absicht
TL;DR
Matt Maher hat ChatGPT 5.5 und Opus 4.7 mit dem CARE-Test (Capture and Recovery Eval) gegeneinander antreten lassen. Beide Modelle können komplexe Aufgaben sauber zerlegen, verlieren aber im Verlauf eines Chats häufig den ursprünglichen User-Intent. Wer das versteht, kann mit klügeren Prompt-Strukturen deutlich bessere Ergebnisse rausholen – statt sich über „dumme" AI zu ärgern.
Nauti's Take
Hilfreich: Wir verstehen endlich, warum lange Chats oft entgleisen – Modelle vergessen schlicht den Original-Intent. Haken: Diese Erkenntnis bringt nur etwas, wenn man Prompt-Disziplin wirklich aufbaut, das ist echte Arbeit.
Power-User mit strukturierten Prompts gewinnen massiv; Casual-User merken den Unterschied erst, wenn sie ihre Workflows härten.