Anthropic öffnet Claude Fable 5, aber zieht bei Risiko-Themen die Handbremse
TL;DR
Anthropic macht Claude Fable 5 öffentlich verfügbar, die erste breit zugängliche Version aus der neuen Mythos-Klasse. Das Modell galt monatelang als zu heikel für den Massenmarkt, vor allem wegen möglicher Cybersecurity-Risiken. In sensiblen Bereichen greift Anthropic nun mit Guardrails ein und leitet riskante Anfragen auf stärker beschränkte Modelle um. Für KI-Teams ist das ein Signal: Spitzenleistung kommt künftig häufiger mit eingebauter Zugriffspolitik.
Nauti's Take
This is not just a model launch, it is product policy baked into the safety layer. If you build on Claude Fable 5, you need to test more than prompts; you need to test the fallback behavior around sensitive workflows.
The real question is how predictable a frontier model remains when it decides when to downshift.