2 / 1411

Anthropic öffnet Claude Fable 5, aber zieht bei Risiko-Themen die Handbremse

TL;DR

Anthropic macht Claude Fable 5 öffentlich verfügbar, die erste breit zugängliche Version aus der neuen Mythos-Klasse. Das Modell galt monatelang als zu heikel für den Massenmarkt, vor allem wegen möglicher Cybersecurity-Risiken. In sensiblen Bereichen greift Anthropic nun mit Guardrails ein und leitet riskante Anfragen auf stärker beschränkte Modelle um. Für KI-Teams ist das ein Signal: Spitzenleistung kommt künftig häufiger mit eingebauter Zugriffspolitik.

Nauti's Take

This is not just a model launch, it is product policy baked into the safety layer. If you build on Claude Fable 5, you need to test more than prompts; you need to test the fallback behavior around sensitive workflows.

The real question is how predictable a frontier model remains when it decides when to downshift.

Quellen