Rocketgraph verdichtet Millionen Logs zu KI-Debug-Snapshots
TL;DR
Rocketgraph ist ein Apache-2.0-Projekt für selbst gehostetes Log-Clustering und Streaming-Anomalieerkennung. Es soll neben bestehende Observability-Stacks wie Datadog, Loki, CloudWatch, Sentry oder ClickHouse gesetzt werden, ohne eine zweite Ingest-Pipeline aufzubauen. Der ML-Kern verdichtet rohe Logs zu Struktur-Templates und bewertet Auffälligkeiten. Laut README läuft das deterministisch mit Drain3, Isolation Forest und Half-Space-Trees; der LLM-Teil ist optional und erklärt nur die gefundenen Cluster.
Nauti's Take
Die gute Idee ist nicht der LLM-Glanz, sondern die Vorarbeit davor: Logs werden erst strukturiert, verdichtet und bewertet, bevor ein Modell irgendetwas erklären darf. Genau so sollte AI-Ops aussehen.
Der Haken: Die README-Zahlen zeigen Potenzial, aber noch keine belastbare Production-Wahrheit. Entscheidend wird sein, ob Rocketgraph bei verrauschten Logs, wechselnden Schemas und vielen Services weniger Arbeit erzeugt, statt nur ein hübscheres Triage-Fenster zu liefern.
Einordnunganzeigen
Observability wird zum Engpass, wenn AI-Agenten mehr Code schreiben, aber Menschen weiter in Dashboards und Query-Sprachen suchen müssen. Rocketgraph greift ein echtes Problem auf: Nicht jede Störung ist ein bekannter Alert, oft steckt sie in einer seltenen neuen Log-Struktur. Wenn die Verdichtung zuverlässig ist, bekommen SREs und LLM-Agenten einen viel kleineren, besser prüfbaren Kontext.