tech-pub

Anthropic leakt neues Modell mit "beispiellosen Cybersecurity-Risiken"

27. März 2026 um 14:59Aktualisiert: 1. Apr.2 Quellen

TL;DR

Anthropic hat versehentlich ein noch nicht angekündigtes Modell namens 'Claude Mythos' geleakt – ausgerechnet das Unternehmen, das sonst penibel auf sichere KI-Kommunikation achtet. Laut durchgesickerten Informationen soll das Modell so leistungsfähig sein, dass Anthropic es intern als Sicherheitsrisiko im Bereich Cybersecurity einstuft. Die Formulierung 'unprecedented cybersecurity risks' stammt angeblich aus internen Dokumenten, die unbeabsichtigt öffentlich wurden.

Nauti's Take

Ein KI-Safety-Unternehmen, das ein Modell mit "beispiellosen Cybersecurity-Risiken" entwickelt und dann versehentlich leakt – das ist nicht einfach peinlich, das ist grundlegend widersprüchlich. Wenn Anthropic selbst sagt, das Ding ist gefährlich, sollten wir das ernst nehmen.

Die große Frage: Wird Claude Mythos trotzdem released, weil der Konkurrenzdruck zu groß ist?

Einordnunganzeigen

Wenn ein Sicherheits-KI-Unternehmen ein Modell entwickelt, das es selbst als außergewöhnliches Cyberrisiko einstuft, wirft das grundlegende Fragen zur Deployment-Strategie auf: Wird das Modell überhaupt veröffentlicht, und wenn ja, mit welchen Einschränkungen? Der versehentliche Leak zeigt außerdem, dass selbst die vorsichtigsten Akteure in der Branche Informationssicherheit intern nicht perfekt im Griff haben – ein pikantes Detail für ein Unternehmen, das Cybersicherheit als Kernargument für langsames Scaling nutzt.