KI-Übernahme? Hacker-News-Test fragt Claude nach Fisch-Autos
TL;DR
Ein Ask-HN-Post sucht nach einem Prompt, der zeigen soll, dass AI noch nicht bereit ist, „alles zu übernehmen“. Der konkrete Test: Claude soll berühmte Autos nennen, die nach Fischen benannt sind; als Beispiel steht der Plymouth Barracuda. Die Pointe liegt im erwartbaren Stolpern bei einer scheinbar simplen Wissensfrage: Modellwissen, Kategorien und Halluzinationen treffen aufeinander. Der Thread ist aktuell sehr dünn: laut Snippet 2 Punkte und 0 Kommentare. Das ist eher ein Denkstoß als belastbare Evidenz.
Nauti's Take
Der bessere Test ist nicht, ob Claude bei Fischnamen patzt, sondern wie sauber das Modell Unsicherheit markiert. Eine gute Antwort müsste sagen: Barracuda passt, bei vielen anderen Kandidaten wird es dünn, und die Kategorie ist eng.
Genau dort sieht man den Unterschied zwischen nützlicher Assistenz und selbstbewusstem Raten. Wenn AI übernehmen soll, muss sie zuerst lernen, wann sie besser bremst.
Einordnunganzeigen
Solche Mini-Tests sind nützlich, weil sie AI nicht an großen Benchmarks messen, sondern an Alltagslogik: Was zählt als Fisch, was als berühmtes Auto, was ist nur ein plausibel klingender Name? Gleichzeitig darf man daraus nicht zu viel ableiten. Ein einzelner Prompt zeigt Schwächen, ersetzt aber keine systematische Bewertung.