3 / 1510

Startup Subquadratic meldet Durchbruch bei der Millionen-Token-Bremse von LLMs

TL;DR

Das Miami-Startup Subquadratic ist im Mai 2026 aus dem Stealth-Modus gekommen und behauptet, einen mathematischen Engpass bei LLMs gelöst zu haben. Gemeint ist sehr wahrscheinlich der Kostenblock rund um lange Kontexte und Attention: Je länger die Eingabe, desto teurer werden Speicher und Rechenzeit. Die erste Ankündigung war dünn, deshalb war die Skepsis groß. Laut MIT Technology Review liefert Subquadratic nun erste Belege nach.

Nauti's Take

Der Name ist fast zu perfekt: Subquadratic behauptet, das subquadratische Problem zu knacken. Genau deshalb lohnt sich doppelte Vorsicht.

Solange nur ausgewählte Belege auf dem Tisch liegen, ist das keine neue LLM-Ära, sondern ein Kandidat für eine echte technische Verschiebung. Relevant wird es, wenn unabhängige Teams die Resultate nachbauen und Nutzer merken, dass lange Kontexte billiger werden, ohne dass Antworten schlechter oder instabiler werden.

Einordnunganzeigen

Wenn Subquadratic recht hat, wäre das mehr als ein normaler Effizienztrick. Günstigere lange Kontexte könnten LLMs bei Codebasen, Dokumentensammlungen, Agentenläufen und Video- oder Audio-Inputs deutlich brauchbarer machen. Aber in diesem Feld klingen viele Durchbrüche stark, bis Benchmarks, Reproduktion und Hardware-Realität sie kleiner machen.

Quellen