18 / 1495

Weißes Haus verlangt von Anthropic jailbreak-festes Claude Fable 5

TL;DR

WIRED berichtet am 17. Juni 2026: US-Regierungsvertreter wollen Claude Fable 5 erst wieder freigeben lassen, wenn Anthropic Jailbreaks gegen die Guardrails wirksam ausschließt. Das Modell war laut Artikel in der Vorwoche per Exportkontrollen offline gegangen, nachdem die NSA Umgehungen für Sperren rund um Cyber-, Chemie- und Bio-Fähigkeiten gesehen haben soll.

Nauti's Take

Die Forderung aus dem Weißen Haus klingt nach gesundem Menschenverstand, ist technisch aber zu absolut formuliert. Kein Frontier-Modell wird durch einen magischen Guardrail-Schalter sicher.

Anthropic sollte zeigen müssen, wie gut Fable 5 Angriffe erkennt, wie schnell Lücken geschlossen werden und welche Fähigkeiten bei erhöhtem Risiko gedrosselt werden. Wer unknackbare AI verlangt, schafft vor allem Theater: Labore schreiben bessere Sicherheitsfolien, Angreifer testen weiter.

Einordnunganzeigen

Wenn eine Behörde die Freigabe eines Frontier-Modells an nicht umgehbare Guardrails knüpft, wird aus Sicherheitsarbeit ein politischer Absolutheits-Test. Für Anbieter heißt das: Red-Teaming, Dokumentation und schnelle Patches werden wichtiger als das Versprechen völliger Kontrolle. Für Nutzer bleibt die unbequeme Wahrheit, dass Modell-Sicherheit eher laufender Betrieb als einmalige Zertifizierung ist.

Quellen