Hermes Agent lernt aus eigenen Fehlern und schreibt seine Skills alle 15 Tasks neu
TL;DR
Hermes Agent von Nous Research verfügt über eine selbstverbessernde Feedback-Schleife, die alle 15 Tasks die eigene Performance auswertet.
Key Points
- Das System analysiert Erfolge und Misserfolge und schreibt danach seine eigenen Skills gezielt um – ohne menschliches Eingreifen.
- Zentrales Feature ist das sogenannte 'Generic Skill'-System, das abstrakte Fähigkeiten aus konkreten Erfahrungen destilliert.
- Der Agent speichert Learnings persistent, sodass Verbesserungen über einzelne Sitzungen hinaus erhalten bleiben.
Nauti's Take
Selbstverbessernde Agenten klingen nach Science-Fiction, aber Hermes zeigt, dass der Ansatz technisch umsetzbar ist – zumindest im kontrollierten Rahmen. Die 15-Task-Schleife ist ein pragmatischer Kompromiss: oft genug für echtes Lernen, selten genug um Instabilität zu vermeiden.
Spannend wird, wie das System mit widersprüchlichen Erfahrungen umgeht – und ob es irgendwann schlechte Gewohnheiten einlernt, die schwer rückgängig zu machen sind. Nous Research liefert hier einen der interessanteren Open-Source-Agenten-Ansätze der letzten Monate.