Diese KI-Workstations sehen aus wie PCs – leisten aber deutlich mehr
TL;DR
Normale Laptops können nur LLMs mit 8–13 Milliarden Parametern laden – Frontier-Modelle haben vermutlich über eine Billion Parameter.
Key Points
- Tenstorrent's QuietBox 2 sieht aus wie ein PC, enthält aber vier eigene Blackhole-KI-Beschleuniger, 128 GB GDDR6 und 256 GB DDR5 – insgesamt 384 GB Speicher.
- Mit dieser Konfiguration lässt sich OpenAIs GPT-OSS-120B laden und mittelgroße Modelle flüssig betreiben.
- Der QuietBox 2 will die Lücke zwischen Consumer-PCs und teuren Rechenzentrum-Clustern schließen.
Nauti's Take
Der Formfaktor ist clever: Ein Gerät, das wie ein normaler PC aussieht, aber im Inneren ein Mini-Rechenzentrum ist, senkt die Hemmschwelle für Unternehmen, die lokale KI wollen, aber keine Serverräume haben. Vier Blackhole-Chips und fast 400 GB Gesamtspeicher sind für einen Desktop-Formfaktor beeindruckend.
Die eigentliche Frage ist Software-Ökosystem und Preis – Nvidias Dominanz liegt nicht nur an der Hardware, sondern an CUDA. Tenstorrent muss Entwickler überzeugen, und das ist der härtere Kampf.
Hintergrund
Der Bedarf an lokaler KI-Inferenz wächst – aus Datenschutzgründen, wegen Latenz und schlicht wegen der Cloud-Kosten. Bisher scheiterten selbst High-End-Workstations an Modellen jenseits von 70 Milliarden Parametern. Tenstorrent adressiert das mit proprietärer Hardware, die speziell für große Speicherbandbreite ausgelegt ist.
Wenn solche Geräte massentauglich werden, verändert das, wer überhaupt leistungsfähige KI betreiben kann – ohne monatliche API-Rechnung.