3 / 1485

AWS spart SageMaker-Nutzern den S3-Umweg für kleine Async-Inference-Requests

TL;DR

Amazon SageMaker AI Async Inference kann Eingaben jetzt direkt im Body von InvokeEndpointAsync annehmen. Für Payloads bis 128.000 Byte entfällt der bisher nötige Upload der Eingabedaten nach Amazon S3 vor jedem Aufruf. Der neue Body-Parameter ist eine Alternative zu InputLocation. Beide dürfen nicht zusammen gesetzt werden; Größen- und Kombinationsfehler liefert die API sofort als ValidationError zurück.

Nauti's Take

AWS verkauft hier eine kleine API-Änderung als Launch, aber die Änderung trifft einen echten Nerv. Wer produktive ML-Workflows betreibt, weiß: Das Ärgerliche sind oft nicht die Modelle, sondern die Nebenstrecken aus Buckets, IAM, Lifecycle-Regeln und Sonderfällen.

Die 128-KB-Grenze hält den Scope sauber. Für große Dateien bleibt S3 sinnvoll; für kleine Jobs war der Umweg schlicht Ballast.

Einordnunganzeigen

Für Teams, die kurze JSON-Prompts, strukturierte Daten oder kleine Textjobs asynchron verarbeiten, senkt AWS hier vor allem Reibung: weniger S3-Setup, weniger Berechtigungen, weniger Fehlerquellen. Der alte S3-Pfad bleibt wichtig für große Dateien und Audit-Fälle, aber viele Agenten- und Automatisierungsjobs bekommen einen deutlich schlankeren Aufrufweg.

Quellen