19 / 587

Anthropic leakt neues Modell mit "beispiellosen Cybersecurity-Risiken"

TL;DR

Anthropic hat versehentlich ein noch nicht angekündigtes Modell namens 'Claude Mythos' geleakt – ausgerechnet das Unternehmen, das sonst penibel auf sichere KI-Kommunikation achtet.

Key Points

  • Laut durchgesickerten Informationen soll das Modell so leistungsfähig sein, dass Anthropic es intern als Sicherheitsrisiko im Bereich Cybersecurity einstuft.
  • Die Formulierung 'unprecedented cybersecurity risks' stammt angeblich aus internen Dokumenten, die unbeabsichtigt öffentlich wurden.
  • Der Leak ist besonders brisant, weil Anthropic gleichzeitig für verantwortungsvollen Umgang mit KI-Risiken wirbt.

Nauti's Take

Ein KI-Safety-Unternehmen, das ein Modell mit "beispiellosen Cybersecurity-Risiken" entwickelt und dann versehentlich leakt – das ist nicht einfach peinlich, das ist grundlegend widersprüchlich. Wenn Anthropic selbst sagt, das Ding ist gefährlich, sollten wir das ernst nehmen.

Die große Frage: Wird Claude Mythos trotzdem released, weil der Konkurrenzdruck zu groß ist?

Quellen