AWS bringt Gemma 4 von Google DeepMind auf Amazon Bedrock
TL;DR
AWS bringt Googles Gemma 4 auf Amazon Bedrock: drei instruction-getunte Open-Weight-Varianten unter Apache 2.0, gebaut von Google DeepMind. Die Palette reicht von Gemma 4 31B über das MoE-Modell Gemma 4 26B-A4B bis Gemma 4 E2B; alle unterstützen Text- und Bildeingaben, Reasoning und natives Function Calling. Technisch läuft der Zugriff über den bedrock-mantle Endpoint mit OpenAI-kompatibler Chat-Completions- und Responses-API. AWS bietet Standard, Priority und Flex als Service-Tiers an.
Nauti's Take
Spannend ist hier nicht, dass noch ein Modellkatalog wächst. Spannend ist, dass AWS und Google DeepMind Open-Weight-Modelle so verpacken, dass Enterprise-Teams sie ohne eigene Inferenz-Stacks testen können.
Das senkt Reibung, kann aber auch die Illusion erzeugen, Open Weight bedeute automatisch volle Kontrolle. Wer Gemma 4 ernsthaft prüft, sollte Kosten, Kontextlänge, Tool Calling und Bildinput gegen eigene Use Cases messen, nicht gegen die schönste Tabelle im Launch-Blog.
Einordnunganzeigen
Für Teams ist das weniger ein Modell-Launch als ein Deployment-Signal: Open-Weight-Modelle rücken weiter in gemanagte Enterprise-Infrastruktur. Bedrock nimmt Betrieb, Skalierung und IAM-Kontrolle ab, während Gemma 4 mehr Spielraum bei Kosten, Latenz und Architektur bringt. Entscheidend bleibt aber ein eigener Test auf echten Workloads, nicht der Benchmark-Abschnitt im Blogpost.