AWS bringt Google DeepMinds Gemma 4 als Open-Weight-KI zu Bedrock
TL;DR
Amazon Bedrock nimmt die Gemma 4 Familie von Google DeepMind auf. Die Modelle sind open-weight, stehen unter Apache 2.0 und laufen als vollständig gemanagter AWS-Service. Verfügbar sind Gemma 4 31B, Gemma 4 26B-A4B und Gemma 4 E2B. Sie decken dichte Modelle, Mixture-of-Experts und eine kompakte E2B-Variante ab. Alle Varianten unterstützen Text- und Bildeingaben, eingebaute Reasoning-Modi und native Function Calls für agentische Workflows.
Nauti's Take
Der Launch ist klar PR-lastig, aber der Kern ist relevant: AWS macht offene Google-Modelle einfacher einkaufbar und leichter in bestehende Enterprise-Setups integrierbar. Spannend ist besonders die 26B-A4B-Variante, weil MoE in der Theorie große Modellkapazität mit kleineren Inferenzkosten verbindet.
Trotzdem zählt nicht die Modellkarte, sondern der eigene Benchmark: Tool Calls, Bildverständnis, lange Kontexte und Reasoning müssen im konkreten Prozess sauber liefern.
Einordnunganzeigen
Das ist vor allem für Teams interessant, die offene Modelle nutzen wollen, aber Betrieb, Berechtigungen und Skalierung nicht selbst bauen möchten. Gemma 4 wird dadurch weniger zum Bastelmodell und mehr zu einer produktionsnahen Option in AWS-Stacks. Entscheidend bleibt, ob Kosten, Latenz und Qualität in echten Workloads besser sind als bei bestehenden Bedrock-Modellen.