1 / 1452

AWS holt Googles offene Gemma 4-Modelle in Amazon Bedrock

TL;DR

AWS bringt die Google-DeepMind-Familie Gemma 4 auf Amazon Bedrock. Verfügbar sind drei instruction-getunte Modelle: Gemma 4 31B, Gemma 4 26B-A4B und Gemma 4 E2B, veröffentlicht unter Apache 2.0. Die Varianten decken dichte Modelle und Mixture-of-Experts ab. 26B-A4B hat 25,2B Parameter, aktiviert pro Token aber nur 3,8B. 31B und 26B-A4B unterstützen 256K Kontext, E2B 128K.

Nauti's Take

AWS macht aus einem offenen Modell kein Bastelprojekt, sondern einen einkaufbaren Enterprise-Baustein. Genau dort wird es für viele Firmen relevant: Nicht, weil Gemma 4 plötzlich jedes Spitzenmodell schlägt, sondern weil Beschaffung, IAM, API-Zugriff und Betrieb in eine bekannte AWS-Schiene fallen.

Der Haken: Wer nur die Launch-Benchmarks liest, optimiert auf Folien. Entscheidend sind eigene Tests mit echten Bildern, langen Dokumenten, Tool Calls und den Kosten pro erledigtem Job.

Einordnunganzeigen

Für Teams auf AWS wird Gemma 4 damit deutlich einfacher testbar: kein eigenes Hosting, keine eigene Inferenz-Schicht, trotzdem offene Gewichte und Apache-2.0-Lizenz. Interessant ist vor allem die Kombination aus langen Kontextfenstern, Bildinput und Tool Calling. Der eigentliche Test liegt bei Kosten, Latenz und Qualität in echten Agenten- und Dokumenten-Workflows.

Quellen