AWS und Vexcel machen Luftbilder per Sprache durchsuchbar
TL;DR
AWS und Vexcel zeigen eine Pipeline, die Luftbilder per natürlicher Sprache durchsuchbar macht: Amazon Bedrock erzeugt multimodale Embeddings und Captions, Amazon OpenSearch Serverless übernimmt die Vektorsuche. Getestet wurden rund 100 Konfigurationen auf Luftbildern von Grant Park in Chicago, mit OpenStreetMap als Ground Truth und zwei Benchmarks: Swimmingpools als diskrete Objekte und Straßen als verteilte Infrastruktur.
Nauti's Take
Das ist klarer Vendor-Content, aber mit brauchbaren Zahlen statt leerer Plattform-Rhetorik. Der wichtigste Punkt: Erst evaluieren, dann Architektur feiern.
Gerade bei Luftbildern reicht ein schickes Embedding nicht, weil Blickwinkel, Feature-Dichte und Query-Typ die Ergebnisse massiv verändern. Wer so etwas baut, sollte die Evaluation als Kernprodukt behandeln, nicht als Reporting-Anhang.
Einordnunganzeigen
Das Spannende ist weniger die AWS-Architektur als die Verschiebung im Workflow: Geodaten müssen nicht mehr für jede Frage neu gelabelt und trainiert werden. Wenn die Evaluation sauber ist, werden Luftbildarchive zu abfragbaren Wissensbasen. Genau dort entscheidet sich, ob multimodale AI nur Demo bleibt oder reale Sucharbeit ersetzt.