Weißes Haus blockt Claude Fable 5: Anthropic soll alle Jailbreaks schließen
TL;DR
Die Trump-Regierung macht Anthropic laut WIRED eine harte Bedingung: Claude Fable 5 soll erst wieder freigegeben werden, wenn sich seine Sicherheitsregeln nicht mehr per Jailbreak umgehen lassen. Fable 5 wurde vergangene Woche wegen Exportkontrollen vom Netz genommen. Der Streit dreht sich darum, ob Nutzer über Prompt-Tricks an abgesperrte Mythos-Fähigkeiten für Cybersecurity, Chemie und Biologie kommen könnten.
Nauti's Take
Die Forderung klingt stark, ist technisch aber wacklig. Wer ein mächtiges Modell veröffentlicht und dann nur auf Guardrails vertraut, verkauft Kontrolle, die er nicht wirklich hat.
Gleichzeitig wirkt die Regierungsposition wie ein Wunsch nach mathematischer Sicherheit in einem System, das probabilistisch, adaptiv und angreifbar bleibt. Der sinnvollere Maßstab wäre nicht „kein Jailbreak“, sondern klare Schwellen für Risiko, Monitoring, unabhängige Tests und schnelle Deaktivierung im Ernstfall.
Einordnunganzeigen
Der Fall zeigt, wie schnell AI-Sicherheit von Produktfrage zu nationaler Sicherheitsfrage wird. Wenn Behörden absolute Unumgehbarkeit verlangen, setzen sie einen Standard, den heutige Modelle kaum erfüllen können. Für Anbieter heißt das: Red-Teaming, Offenlegung und Zugriffskontrolle werden politisch wichtiger als bloße Sicherheitsversprechen.