DeepSeek AI: 90% weniger Tokens als die Milliarden-Modelle
TL;DR
DeepSeek AI zeigt einen neuen Ansatz fürs visuelle Reasoning: Statt ausführlicher Textbeschreibungen nutzt das Modell einen Pointing-Mechanismus, der seine Reasoning-Schritte direkt auf Bildobjekten markiert. Das senkt den Rechenaufwand drastisch und kommt menschlicher Wahrnehmung näher. Laut Geeky Gadgets reicht DeepSeek damit an die Leistung von Milliarden-Dollar-Modellen heran – mit rund 90% weniger Tokens. Spannend für alle, die KI-Bildverstehen kosteneffizient skalieren wollen.
Nauti's Take
Effizienzsprung mit Potenzial: Wenn DeepSeek mit Pointing statt Textbeschreibungen tatsächlich an Milliarden-Modelle herankommt, drückt das die Inferenzkosten massiv und öffnet visuelles Reasoning auch für kleinere Player. Der Haken: Solche Benchmarks sind oft cherry-picked, und ohne unabhängige Reproduktion bleibt der Wow-Faktor erstmal Marketing.
Wer Vision-AI produktiv einsetzt, sollte den Ansatz testen – aber nicht blind die bestehende Pipeline ersetzen.