ProofShot: Browser-Sicht für KI-Coding-Agenten – UI-Bugs endlich sichtbar machen
TL;DR
ProofShot ist ein CLI-Tool, das AI-Coding-Agenten (Claude Code, Cursor, Codex usw.) erstmals echte Browser-Sicht gibt – sie können Seiten öffnen, klicken, Screenshots machen und Console-Errors erfassen.
Key Points
- Der Agent nimmt per Shell-Commands eine Session auf und packt Video, Screenshots und Logs in eine einzige selbstständige HTML-Datei zur schnellen Review.
- Gebaut auf Vercels agent-browser, das laut Entwickler deutlich schneller ist als Playwright MCP – kein Test-Framework, sondern ein Verifikations-Layer.
- Das Tool wird als 'Skill' geliefert, damit der Agent seine eigenen Fähigkeiten kennt und gezielt einsetzen kann.
Nauti's Take
Das Konzept ist simpel und genau deshalb clever: Nicht das Modell smarter machen, sondern den Informationsfluss reparieren. Wer je zugesehen hat, wie ein Agent stolz einen broken Layout-Bug committet, weil er schlicht nie einen Screenshot gesehen hat, versteht den Schmerzpunkt sofort.
Dass es auf Shell-Commands basiert und agnostisch gegenüber dem verwendeten Agenten bleibt, ist die richtige Architektur-Entscheidung – kein Vendor-Lock-in, maximale Kompatibilität. Offen bleibt, wie robust es bei komplexen SPAs oder Auth-Walls performt, aber als Ansatz zeigt ProofShot, wohin der Trend geht: Agenten brauchen Sinne, nicht nur mehr Parameter.