tech-pub

Nvidia Groq 3: Die Ära der KI-Inferenz hat (wahrscheinlich) begonnen

16. März 2026 um 21:04Aktualisiert: 20. März1 Quellen

TL;DR

Nvidia-CEO Jensen Huang hat auf der GTC-Konferenz in San Jose (30.000+ Besucher) die Vera-Rubin-Chip-Generation vorgestellt – Nvidias erster Chip, der explizit für KI-Inferenz ausgelegt ist. Technologische Basis: Das Nvidia Groq 3 LPU (Language Processing Unit) nutzt IP, das Nvidia zu Weihnachten 2024 für 20 Milliarden US-Dollar vom Start-up Groq lizenziert hat. Huang erklärte den Moment zum Wendepunkt: KI müsse jetzt 'denken' und 'handeln' – beides erfordere Inferenz, nicht Training.

Nauti's Take

Nvidia kauft sich für 20 Milliarden Dollar in die Inferenz-Welt ein und nennt das Ergebnis 'Groq 3' – ein cleverer Schachzug, der gleichzeitig den gefährlichsten Konkurrenten neutralisiert und eigene Schwäche eingesteht. Wer sein Kerngeschäft jahrelang auf Training-GPUs aufgebaut hat, braucht offenbar externe IP, um für die nächste Phase gerüstet zu sein.

Huangs Rhetorik ('KI muss jetzt denken') klingt nach Marketing-Zündstoff, trifft aber einen echten Nerv: Der Markt für Inferenz-Hardware ist gigantisch und bisher vergleichsweise unbesetzt von Nvidia. Die eigentliche Frage ist nicht ob, sondern wie schnell die Konkurrenz – AMD, Intel, Groq selbst als eigenständiger Player – antwortet.

Einordnunganzeigen

Jahrelang dominierte das Training die KI-Hardware-Debatte – wer die größten Cluster baut, gewinnt. Doch produktiver KI-Einsatz in der Praxis läuft fast ausschließlich über Inferenz: Millionen von Anfragen pro Sekunde, Latenz zählt, Kosten auch. Dass Nvidia jetzt dedizierte Inferenz-Hardware bringt und dabei Groq-IP für 20 Milliarden Dollar lizenziert, zeigt, wie ernst der Markt diesen Shift nimmt.

Für Unternehmen bedeutet das potenziell günstigere und schnellere KI-Deployments – falls Nvidia liefert.

Quellen

16.3.26

With Nvidia Groq 3, the Era of AI Inference Is (Probably) Here

#nvidia

TL;DR

Nauti's Take

Quellen

Ähnliche Stories

Beiträge aus dem Newsletter