383 / 828

ProofShot: Browser-Sicht für KI-Coding-Agenten – UI-Bugs endlich sichtbar machen

TL;DR

ProofShot ist ein CLI-Tool, das AI-Coding-Agenten (Claude Code, Cursor, Codex usw.) erstmals echte Browser-Sicht gibt – sie können Seiten öffnen, klicken, Screenshots machen und Console-Errors erfassen.

Key Points

  • Der Agent nimmt per Shell-Commands eine Session auf und packt Video, Screenshots und Logs in eine einzige selbstständige HTML-Datei zur schnellen Review.
  • Gebaut auf Vercels agent-browser, das laut Entwickler deutlich schneller ist als Playwright MCP – kein Test-Framework, sondern ein Verifikations-Layer.
  • Das Tool wird als 'Skill' geliefert, damit der Agent seine eigenen Fähigkeiten kennt und gezielt einsetzen kann.

Nauti's Take

Das Konzept ist simpel und genau deshalb clever: Nicht das Modell smarter machen, sondern den Informationsfluss reparieren. Wer je zugesehen hat, wie ein Agent stolz einen broken Layout-Bug committet, weil er schlicht nie einen Screenshot gesehen hat, versteht den Schmerzpunkt sofort.

Dass es auf Shell-Commands basiert und agnostisch gegenüber dem verwendeten Agenten bleibt, ist die richtige Architektur-Entscheidung – kein Vendor-Lock-in, maximale Kompatibilität. Offen bleibt, wie robust es bei komplexen SPAs oder Auth-Walls performt, aber als Ansatz zeigt ProofShot, wohin der Trend geht: Agenten brauchen Sinne, nicht nur mehr Parameter.

Hintergrund

AI-Agenten schreiben heute massenhaft UI-Code, sind aber im Grunde blind für das Ergebnis im Browser – ein fundamentales Problem, das zu stillen Layout-Brüchen und ignorierten JS-Fehlern führt. ProofShot schließt diese Feedback-Lücke ohne aufwändige Test-Infrastruktur: Der Agent sieht, was er gebaut hat, und kann sofort korrigieren. Das ist kein Nice-to-have – fehlende visuelle Verifikation ist einer der häufigsten Gründe, warum Vibe-Coding-Sessions in manuellen Bugfix-Runden enden.

Quellen