ProofShot: Browser-Sicht für KI-Coding-Agenten – UI-Bugs endlich sichtbar machen
TL;DR
ProofShot ist ein CLI-Tool, das AI-Coding-Agenten (Claude Code, Cursor, Codex usw.) erstmals echte Browser-Sicht gibt – sie können Seiten öffnen, klicken, Screenshots machen und Console-Errors erfassen.
Key Points
- Der Agent nimmt per Shell-Commands eine Session auf und packt Video, Screenshots und Logs in eine einzige selbstständige HTML-Datei zur schnellen Review.
- Gebaut auf Vercels agent-browser, das laut Entwickler deutlich schneller ist als Playwright MCP – kein Test-Framework, sondern ein Verifikations-Layer.
- Das Tool wird als 'Skill' geliefert, damit der Agent seine eigenen Fähigkeiten kennt und gezielt einsetzen kann.
Nauti's Take
Das Konzept ist simpel und genau deshalb clever: Nicht das Modell smarter machen, sondern den Informationsfluss reparieren. Wer je zugesehen hat, wie ein Agent stolz einen broken Layout-Bug committet, weil er schlicht nie einen Screenshot gesehen hat, versteht den Schmerzpunkt sofort.
Dass es auf Shell-Commands basiert und agnostisch gegenüber dem verwendeten Agenten bleibt, ist die richtige Architektur-Entscheidung – kein Vendor-Lock-in, maximale Kompatibilität. Offen bleibt, wie robust es bei komplexen SPAs oder Auth-Walls performt, aber als Ansatz zeigt ProofShot, wohin der Trend geht: Agenten brauchen Sinne, nicht nur mehr Parameter.
Hintergrund
AI-Agenten schreiben heute massenhaft UI-Code, sind aber im Grunde blind für das Ergebnis im Browser – ein fundamentales Problem, das zu stillen Layout-Brüchen und ignorierten JS-Fehlern führt. ProofShot schließt diese Feedback-Lücke ohne aufwändige Test-Infrastruktur: Der Agent sieht, was er gebaut hat, und kann sofort korrigieren. Das ist kein Nice-to-have – fehlende visuelle Verifikation ist einer der häufigsten Gründe, warum Vibe-Coding-Sessions in manuellen Bugfix-Runden enden.