974 / 1162

NVIDIA Nemotron 3 Super: 5x mehr Durchsatz für Agentic AI

TL;DR

NVIDIA hat Nemotron 3 Super veröffentlicht – ein Open-Modell mit 120 Milliarden Parametern gesamt, davon nur 12 Milliarden aktiv (MoE-Architektur).

Key Points

  • Der Hersteller verspricht fünffach höheren Durchsatz gegenüber vergleichbaren Dense-Modellen – speziell für agentic AI ausgelegt.
  • Perplexity integriert das Modell direkt und bietet Nutzern bereits Zugang zu Nemotron 3 Super.
  • Das Modell kombiniert fortgeschrittenes Reasoning mit niedriger Inferenzlast und soll autonome Agenten effizienter und günstiger machen.

Nauti's Take

5x Durchsatz klingt nach Marketing-Magie, aber die zugrundeliegende MoE-Logik macht den Anspruch zumindest plausibel – solange NVIDIA die Benchmarks transparent hält und nicht nur auf kuratierte Szenarien zeigt. Spannender als die rohe Zahl ist die strategische Botschaft: NVIDIA will der Default-Stack für Agentic AI werden, von der GPU bis zum Modell.

Mit dem Open-Release wird gleichzeitig das Ökosystem gefüttert, das NVIDIAs Hardware braucht, um zu glänzen. Clever – aber auch ein echter Mehrwert für die Community, die endlich ein starkes, offenes Reasoning-Modell für Agenten bekommt.

Hintergrund

Die MoE-Architektur ist hier kein Zufall: Agentic-Systeme führen viele parallele Inferenz-Calls aus – da summieren sich Kosten und Latenz schnell. Ein Modell, das nur 10 % seiner Parameter aktiviert, aber trotzdem 120B-Qualität liefert, verändert die Wirtschaftlichkeit ganzer Agent-Stacks. Wer heute Agentic-Pipelines baut, muss Nemotron 3 Super auf dem Radar haben – vor allem weil NVIDIA das Modell offen bereitstellt und damit auch Selbst-Hosting möglich wird.

Quellen