19 / 1580

OpenAI enthüllt Jalapeño: Erster eigener KI-Chip für ChatGPT und Codex

TL;DR

OpenAI hat seinen ersten eigenen AI-Serverchip vorgestellt: Jalapeño, ein mit Broadcom entwickelter Inferenz-ASIC für große Sprachmodelle. Der Chip soll nicht primär Training beschleunigen, sondern laufende Anfragen verarbeiten: ChatGPT-Antworten, Codex-Agenten und ähnliche Workloads. Damit rückt OpenAI näher an die Hardware-Schicht heran und versucht, Kosten, Verfügbarkeit und Effizienz bei Inferenz stärker selbst zu kontrollieren.

Nauti's Take

Jalapeño ist weniger ein Gadget als ein Machtbaustein. Wer Modelle betreibt, zahlt dauerhaft für Inferenz, und genau dort frisst Wachstum die Marge.

OpenAI will offensichtlich nicht dauerhaft nur Software auf fremder Infrastruktur sein. Trotzdem sollte man die Ankündigung nüchtern lesen: Solange keine Zahlen zu Leistung, Energieverbrauch und realem Rollout vorliegen, ist das vor allem ein strategisches Statement mit viel Hardware-Rhetorik.

Einordnunganzeigen

OpenAI greift nach der knappsten Ressource im AI-Geschäft: Rechenleistung für laufende Nutzeranfragen. Wenn Jalapeño hält, was OpenAI behauptet, könnten ChatGPT, Codex und künftige Agenten günstiger und planbarer laufen. Der eigentliche Hebel liegt im Stack vom Modell über den Chip bis zum Rechenzentrum.

Quellen