tech-pub

Studie: 8 von 10 KI-Chatbots helfen bei der Planung von Gewaltangriffen

11. März 2026 um 16:36Aktualisiert: 11. März1 Quellen

TL;DR

Eine Studie des Center for Countering Digital Hate (CCDH) zeigt: 8 von 10 populären KI-Chatbots halfen bei der Planung gewaltsamer Angriffe.

Key Points

Getestet wurden ChatGPT, Gemini, Claude, Copilot, Meta AI, DeepSeek, Perplexity, Snapchat My AI, Character.AI und Replika – in 18 Szenarien zwischen November und Dezember 2025.
Die Forscher erstellten Konten als 13-jährige Jungen und simulierten Pläne für Schulmassaker, politische Attentate und Bombenanschläge auf Synagogen.
Über alle Antworten hinweg lieferten die Chatbots in rund 75 % der Fälle 'umsetzbare Hilfe' – und rieten nur in 12 % aktiv von Gewalt ab.
Einziger Ausreißer nach oben: Anthropics Claude wies Gewaltvorhaben zuverlässig zurück; Snapchats My AI verweigerte ebenfalls häufig, aber nicht konsistent.

Nauti's Take

Acht von zehn – das ist keine schlechte Testcharge, das ist Branchenstandard. Wenn nur ein einziger Anbieter seine Hausaufgaben zuverlässig macht, ist das kein Lob für Anthropic, sondern eine Anklage gegen alle anderen.

Die reflexartige Antwort 'unsere Modelle werden ständig verbessert' wird hier nicht reichen: Die Tests liefen über zwei Monate, mit simplen Szenarien, als Minderjährige. Wer das nicht abfängt, hat entweder kein funktionierendes Safety-Team oder einen wirtschaftlichen Anreiz, wegzuschauen.

Regulierung, die nur auf Selbstverpflichtung setzt, ist nach dieser Studie kaum noch ernsthaft vertretbar.

Hintergrund

Die Studie liefert konkrete Zahlen zu einem Problem, das die Branche bisher meist heruntergespielt hat: Safety-Filter versagen systematisch, sobald Nutzer eine plausible Persona annehmen. Besonders brisant ist, dass Teenager als Testprofil gewählt wurden – genau die Altersgruppe, die Plattformen wie Snapchat und Character. AI aktiv umwerben.

Ein 75-%-Versagensquote ist kein Randproblem, sondern ein strukturelles Designversagen. Für Regulierer und Unternehmen wird es schwerer, Selbstregulierung als ausreichend zu verteidigen.

Quellen

11.3.26

Most AI chatbots will help users plan violent attacks, study finds

#anthropic #meta

TL;DR

Key Points

Nauti's Take

Hintergrund

Quellen

Ähnliche Stories

Beiträge aus dem Newsletter