Triad Engine macht Gemini Vision historisch glaubwürdig in Rom-Bildern
TL;DR
Forscher testeten 24 Szenarien in Rom 110 n. Chr. mit Gemini Vision und verglichen naive gegen durch die Triad Engine aufgepumpte Prompts. Bei unverändertem Modell und Pipeline sprang der historische Realitätswert von 12,5 auf 83,3 Prozent, weil der Triad-Prompt Begriffe in Szene übersetzt statt einfach lateinische Ausdrücke zu liefern. In 23 der 24 Paare siegte der grounding Prompt, nie der naive, weil Bildmodelle unbekannte historische Begriffe einfach ausblenden. Prompt Engineers müssen also visuelle Beschreibungen liefern, die das Modell versteht, nicht bloß Fachvokabular zitieren.
Nauti's Take
Image-Models kennen keine Geschichte — sie kennen Pixel. Der Triad Engine beweist brutal: Wer einem AI-Model 'dextrarum iunctio' hinwirft, redet Latein mit einem Labrador.
Übersetze Konzepte in visuelle Primitives, und die Genauigkeit springt von 12,5% auf 83,3%.