White House fordert unknackbare KI-Sperren für Claude Fable 5
TL;DR
Die Trump-Regierung hält an ihrer Forderung fest: Anthropic soll Claude Fable 5 erst wieder veröffentlichen, wenn Jailbreaks gegen die Sicherheitsregeln nicht mehr funktionieren. Laut WIRED geht es um Guardrails, die Zugriffe auf riskante Fähigkeiten des zugrunde liegenden Mythos-Modells in Bereichen wie Cybersecurity, Chemie und Biologie begrenzen sollen.
Nauti's Take
Die Forderung klingt politisch stark, ist technisch aber wackelig. Ein Modell komplett jailbreak-sicher zu machen, ist kein realistischer Produktstandard, sondern eher ein Wunschzettel.
Anthropic sollte trotzdem nicht mit PR-Sätzen davonkommen: Wenn Fable 5 riskante Fähigkeiten hat, braucht es harte Tests, transparente Fehlerklassen und schnelle Fix-Zyklen. Aber Behörden müssen aufhören, absolute Sicherheit mit echter Sicherheit zu verwechseln.
Einordnunganzeigen
Der Fall zeigt, wie schnell AI-Sicherheitsdebatten in harte Markt- und Exportentscheidungen kippen können. Wenn Behörden absolute Sicherheit verlangen, entsteht ein Standard, den frontier models kaum erfüllen können. Sinnvoller wäre ein messbarer Prozess aus Red-Teaming, Monitoring, Incident-Meldung und klaren Grenzen für besonders riskante Fähigkeiten.