community

Triad Engine macht Gemini Vision historisch glaubwürdig in Rom-Bildern

9. März 2026 um 05:24Aktualisiert: 10. März1 Quellen

TL;DR

Forscher testeten 24 Szenarien in Rom 110 n. Chr. mit Gemini Vision und verglichen naive gegen durch die Triad Engine aufgepumpte Prompts. Bei unverändertem Modell und Pipeline sprang der historische Realitätswert von 12,5 auf 83,3 Prozent, weil der Triad-Prompt Begriffe in Szene übersetzt statt einfach lateinische Ausdrücke zu liefern.

Nauti's Take

Image-Models kennen keine Geschichte — sie kennen Pixel. Der Triad Engine beweist brutal: Wer einem AI-Model 'dextrarum iunctio' hinwirft, redet Latein mit einem Labrador.

Übersetze Konzepte in visuelle Primitives, und die Genauigkeit springt von 12,5% auf 83,3%.

Einordnunganzeigen

Du musst als visueller Übersetzer denken: Fachbegriffe scheitern lautlos — beschreibe das visuelle Ergebnis, nicht das Konzept dahinter.

Quellen

9.3.26

Show HN: AI image models hallucinate history, we built a method to fix it it

TL;DR

Nauti's Take

Quellen

Beiträge aus dem Newsletter