tech-pub

White House fordert unknackbare KI-Sperren für Claude Fable 5

17. Juni 2026 um 17:00Aktualisiert: 18. Juni1 Quellen

TL;DR

Die Trump-Regierung will Claude Fable 5 erst wieder freigeben, wenn Anthropic die gemeldeten Jailbreak-Risiken ausräumt. Das Modell wurde nach Exportkontrollbedenken offline genommen. Laut WIRED geht es um Schutzregeln, die den Zugriff auf Mythos-Fähigkeiten in Cybersecurity, Chemie und Biologie begrenzen sollen. Die NSA soll Umgehungen für möglich halten.

Nauti's Take

Die Forderung klingt entschlossen, aber sie verwechselt Schutzgeländer mit Tresortüren. Anthropic kann bessere Tests, klarere Schwellen und schnellere Meldungen liefern.

Es kann aber nicht seriös garantieren, dass kein kreativer Prompt, kein Tool-Chain-Trick und kein künftiges Modell jemals eine Lücke findet. Wer solche Modelle regulieren will, braucht nachvollziehbare Risikostufen statt einer Null-Jailbreak-Fantasie.

Einordnunganzeigen

Der Fall zeigt, wie schnell AI-Sicherheit von Produktfrage zu Staatssache wird. Wenn Behörden verlangen, dass ein Frontier-Modell nicht jailbreakbar ist, setzen sie eine Messlatte, die technisch kaum sauber beweisbar ist. Für Anbieter heißt das: Release-Prozesse, Red-Teaming und Meldewege werden politischer, nicht nur technischer.

Quellen

17.6.26

The White House Wants Anthropic to Block All Jailbreaks. That May Not Be Possible

#anthropic

TL;DR

Nauti's Take

Quellen

Ähnliche Stories

Beiträge aus dem Newsletter