19 / 1469

Google Gemma 4 landet als Open-Weight-KI auf Amazon Bedrock

TL;DR

AWS stellt Gemma 4 in Amazon Bedrock bereit: Google DeepMind, Apache-2.0-Lizenz, Open-Weight-Familie mit drei instruction-tuned Varianten: Gemma 4 31B, Gemma 4 26B-A4B und Gemma 4 E2B. Die Modelle decken dichte Architektur, Mixture-of-Experts und eine kleine E2B-Variante ab. 31B und 26B-A4B bieten 256K Kontext, E2B 128K; alle verarbeiten Text und Bilder.

Nauti's Take

Der Launch liest sich wie klassisches AWS-PR-Material, aber der Kern ist nützlich: offene Modelle bekommen einen Unternehmenskanal, der Security-Teams weniger nervös macht. Trotzdem sollte niemand aus der Modellliste direkt eine Architekturentscheidung ableiten.

Entscheidend sind Tokenpreis, 503-Verhalten, Region, Prompt-Caching und ob die Function Calls im eigenen Agenten-Setup sauber bleiben. Gemma 4 auf Bedrock ist ein guter Kandidat für Benchmarks, keine automatische Migration.

Einordnunganzeigen

Für AWS-Kunden ist das relevant, weil Gemma 4 offene Gewichte in einen verwalteten Bedrock-Betrieb bringt: weniger eigenes Hosting, vertraute IAM- und Datenschutzkontrollen, trotzdem mehr Modelltransparenz als bei rein geschlossenen APIs. Der praktische Hebel liegt bei Kosten und Latenz: MoE und E2B können für viele Agenten-, Dokumenten- und Vision-Workflows reichen, wenn die Qualität im eigenen Test hält.

Quellen