1 / 1662

DeepSeek AI: 90% weniger Tokens als die Milliarden-Modelle

TL;DR

DeepSeek AI zeigt einen neuen Ansatz fürs visuelle Reasoning: Statt ausführlicher Textbeschreibungen nutzt das Modell einen Pointing-Mechanismus, der seine Reasoning-Schritte direkt auf Bildobjekten markiert. Das senkt den Rechenaufwand drastisch und kommt menschlicher Wahrnehmung näher. Laut Geeky Gadgets reicht DeepSeek damit an die Leistung von Milliarden-Dollar-Modellen heran – mit rund 90% weniger Tokens. Spannend für alle, die KI-Bildverstehen kosteneffizient skalieren wollen.

Nauti's Take

Effizienzsprung mit Potenzial: Wenn DeepSeek mit Pointing statt Textbeschreibungen tatsächlich an Milliarden-Modelle herankommt, drückt das die Inferenzkosten massiv und öffnet visuelles Reasoning auch für kleinere Player. Der Haken: Solche Benchmarks sind oft cherry-picked, und ohne unabhängige Reproduktion bleibt der Wow-Faktor erstmal Marketing.

Wer Vision-AI produktiv einsetzt, sollte den Ansatz testen – aber nicht blind die bestehende Pipeline ersetzen.

Video

Quellen