18 / 2207

Microsoft zeigt Memora: Agenten-Gedächtnis mit 98 Prozent weniger Kontext-Tokens

TL;DR

Microsoft Research stellt Memora vor, ein Speichersystem für Langzeit-Agenten, das gespeicherte Inhalte von der Suche danach trennt. Statt komplette Chatverläufe immer wieder ins Kontextfenster zu laden, nutzt Memora kurze Primärabstraktionen und Cue Anchors als Zugriffsschicht. Auf LoCoMo und LongMemEval meldet Microsoft neue Bestwerte: 86,3 Prozent LLM-Judge-Accuracy auf LoCoMo, 87,4 Prozent auf LongMemEval und bis zu 98 Prozent weniger Kontext-Token als Full-Context-Inferenz.

Nauti's Take

Der spannende Punkt ist nicht noch ein größerer Kontext, sondern eine bessere Gedächtnisarchitektur. Memora sagt im Kern: Speichere reichhaltig, suche aber über schlanke, bewusst gesetzte Zugriffspunkte.

Das ist näher an produktiver Arbeit als die übliche RAG-Schublade voller Textsplitter. Trotzdem ist Vorsicht angebracht: Microsoft zeigt starke Zahlen, aber der harte Test kommt erst in chaotischen echten Workflows mit widersprüchlichen Updates, Datenschutzgrenzen und veralteten Informationen.

Einordnunganzeigen

Agenten scheitern heute oft nicht am Denken, sondern am Gedächtnis: Sie verlieren Entscheidungen, Randbedingungen und frühere Begründungen. Memora adressiert genau diese Lücke, indem es Detailtiefe behält, aber den Zugriff schlanker macht. Wenn das außerhalb von Benchmarks hält, wäre das ein Baustein für echte Projekt-, Support- und Research-Agenten über Wochen statt Minuten.

Quellen