17 / 1494

White House fordert unknackbare KI-Sperren für Claude Fable 5

TL;DR

Die Trump-Regierung will Claude Fable 5 erst wieder freigeben, wenn Anthropic die gemeldeten Jailbreak-Risiken ausräumt. Das Modell wurde nach Exportkontrollbedenken offline genommen. Laut WIRED geht es um Schutzregeln, die den Zugriff auf Mythos-Fähigkeiten in Cybersecurity, Chemie und Biologie begrenzen sollen. Die NSA soll Umgehungen für möglich halten.

Nauti's Take

Die Forderung klingt entschlossen, aber sie verwechselt Schutzgeländer mit Tresortüren. Anthropic kann bessere Tests, klarere Schwellen und schnellere Meldungen liefern.

Es kann aber nicht seriös garantieren, dass kein kreativer Prompt, kein Tool-Chain-Trick und kein künftiges Modell jemals eine Lücke findet. Wer solche Modelle regulieren will, braucht nachvollziehbare Risikostufen statt einer Null-Jailbreak-Fantasie.

Einordnunganzeigen

Der Fall zeigt, wie schnell AI-Sicherheit von Produktfrage zu Staatssache wird. Wenn Behörden verlangen, dass ein Frontier-Modell nicht jailbreakbar ist, setzen sie eine Messlatte, die technisch kaum sauber beweisbar ist. Für Anbieter heißt das: Release-Prozesse, Red-Teaming und Meldewege werden politischer, nicht nur technischer.

Quellen