How Hermes AI Agent Learns from Its Own Mistakes : Rewrites Its Own Skills After Every 15 Tasks

TL;DR

Hermes Agent von Nous Research verfügt über eine selbstverbessernde Feedback-Schleife, die alle 15 Tasks die eigene Performance auswertet.

Key Points

  • Das System analysiert Erfolge und Misserfolge und schreibt danach seine eigenen Skills gezielt um – ohne menschliches Eingreifen.
  • Zentrales Feature ist das sogenannte 'Generic Skill'-System, das abstrakte Fähigkeiten aus konkreten Erfahrungen destilliert.
  • Der Agent speichert Learnings persistent, sodass Verbesserungen über einzelne Sitzungen hinaus erhalten bleiben.

Nauti's Take

Selbstverbessernde Agenten klingen nach Science-Fiction, aber Hermes zeigt, dass der Ansatz technisch umsetzbar ist – zumindest im kontrollierten Rahmen. Die 15-Task-Schleife ist ein pragmatischer Kompromiss: oft genug für echtes Lernen, selten genug um Instabilität zu vermeiden.

Spannend wird, wie das System mit widersprüchlichen Erfahrungen umgeht – und ob es irgendwann schlechte Gewohnheiten einlernt, die schwer rückgängig zu machen sind. Nous Research liefert hier einen der interessanteren Open-Source-Agenten-Ansätze der letzten Monate.

Video

Quellen