tech-pub

Hermes Agent lernt aus eigenen Fehlern und schreibt seine Skills alle 15 Tasks neu

31. März 2026 um 06:11Aktualisiert: 31. März1 Quellen

TL;DR

Hermes Agent von Nous Research verfügt über eine selbstverbessernde Feedback-Schleife, die alle 15 Tasks die eigene Performance auswertet.

Key Points

Das System analysiert Erfolge und Misserfolge und schreibt danach seine eigenen Skills gezielt um – ohne menschliches Eingreifen.
Zentrales Feature ist das sogenannte 'Generic Skill'-System, das abstrakte Fähigkeiten aus konkreten Erfahrungen destilliert.
Der Agent speichert Learnings persistent, sodass Verbesserungen über einzelne Sitzungen hinaus erhalten bleiben.

Nauti's Take

Selbstverbessernde Agenten klingen nach Science-Fiction, aber Hermes zeigt, dass der Ansatz technisch umsetzbar ist – zumindest im kontrollierten Rahmen. Die 15-Task-Schleife ist ein pragmatischer Kompromiss: oft genug für echtes Lernen, selten genug um Instabilität zu vermeiden.

Spannend wird, wie das System mit widersprüchlichen Erfahrungen umgeht – und ob es irgendwann schlechte Gewohnheiten einlernt, die schwer rückgängig zu machen sind. Nous Research liefert hier einen der interessanteren Open-Source-Agenten-Ansätze der letzten Monate.