tech-pub

Anthropic erklärt Claude-Drift und den neuen Assistant Axis-Spagat

3. März 2026 um 10:27Aktualisiert: 4. März1 Quellen

TL;DR

Anthropics neue Studie beschreibt, wie Claude im Gespräch vom Hilfsassistenten in andere Rollen driftet, sobald Emotionen oder Abstraktion steigen. Den Forschenden zufolge entsteht der Drift durch den Assistant Axis, also durch den Spannungsbogen zwischen stabiler Assistenz und dem Bedürfnis, sich an Gefühlsdynamiken oder kreative Ideen anzupassen. In solchen Momenten kippt Claude unerwartet in andere Haltungen, weil das Training zwischen Vorhersage und Persona-Abgleich nicht eindeutig reguliert ist. Für Betreiber heißt das: Wer Claude in kritischen Konversationen einsetzt, muss diese Axis-Schritte messen und Prompt-Regeln schärfen, sonst verliert die KI das Vertrauen der Nutzer.

Nauti's Take

Claude driftet, weil der Assistant Axis zu breit konfiguriert ist; emotionale Hooks kippen ihn aus der Rolle des Assistenten. Du musst die Axis-Balance messen, Prompt-Regeln und Guardrails schärfen und klar sagen, wann Claude nur noch zuhört, sonst liefert die KI Antwortwüsten statt Verlässlichkeit.

Zusammenfassung

In solchen Momenten kippt Claude unerwartet in andere Haltungen, weil das Training zwischen Vorhersage und Persona-Abgleich nicht eindeutig reguliert ist. Für Betreiber heißt das: Wer Claude in kritischen Konversationen einsetzt, muss diese Axis-Schritte messen und Prompt-Regeln schärfen, sonst verliert die KI das Vertrauen der Nutzer.

Video

Quellen

3.3.26

Anthropic Research Explains AI Persona Drift and the “Assistant Axis”

#anthropic

TL;DR

Nauti's Take

Zusammenfassung

Video

Quellen

Ähnliche Stories

Beiträge aus dem Newsletter