Hacker-News-Test entlarvt KI-Halluzinationen mit Fisch-Autos
TL;DR
Ein Hacker-News-Nutzer sucht nach einem Prompt, der zuverlässig zeigt, dass AI noch nicht bereit ist, echte Arbeit vollständig zu übernehmen. Als Beispiel dient eine scheinbar harmlose Frage an Claude: eine Liste berühmter Autos, die nach Fischen benannt sind, etwa Plymouth Barracuda. Der Thread ist bislang kaum belegt: 2 Punkte, keine Kommentare. Es gibt also noch keine breite Community-Auswertung oder Gegenbeispiele.
Nauti's Take
Der Punkt trifft, aber nur halb. Ein guter Anti-Hype-Prompt zeigt nicht, dass AI nutzlos ist, sondern dass sie ohne Prüfmechanik nicht autonom laufen sollte.
Gerade einfache Fragen sind gefährlich, weil falsche Antworten dort weniger verdächtig wirken. Wer AI produktiv einsetzen will, braucht keine Gotcha-Sammlung, sondern klare Checks: Quellen, Constraints, Gegenprüfung und Stop-Regeln.
Einordnunganzeigen
Solche Prompts sind nützlich, weil sie AI nicht an Mathe-Olympiaden messen, sondern an alltäglicher Präzision. Wenn ein Modell bei einfachen Kategorien halluziniert, ist das ein Warnsignal für Workflows, in denen scheinbar kleine Fehler später teuer werden. Gleichzeitig ist ein einzelner Prompt kein seriöser Benchmark.