6 / 938

Warum Google DeepMind Single-Score-AI-Tests aufgegeben hat

TL;DR

Google DeepMind hat ein neues Framework zur Bewertung von Artificial General Intelligence (AGI) vorgestellt – und verabschiedet sich damit von klassischen Einzel-Benchmarks. Stattdessen werden KI-Systeme über zehn kognitive Dimensionen analysiert: von Wahrnehmung und Reasoning bis hin zu sozialer Kognition. Das Ergebnis ist ein detailliertes Fähigkeitsprofil, das zeigt, wo ein Modell stark ist und wo es Grenzen hat. Für AI-Practitioners bedeutet das eine deutlich nuanciertere Grundlage zur Modellbewertung.

Nauti's Take

DeepMinds multidimensionales AGI-Framework ist ein überfälliger Schritt – ein einziger Score hat noch nie wirklich erklärt, was ein Modell kann. Zehn kognitive Dimensionen geben endlich ein ehrlicheres Bild, aber das Risiko liegt auf der Hand: Wer die Metriken definiert, definiert, was als 'intelligent' gilt.

Nauti sieht hier echtes Potenzial und eine Machtfrage zugleich.

Video

Quellen