tech-pub

KI auf Vogelgesang trainiert erkennt auch Walgesänge zuverlässig

17. März 2026 um 15:00Aktualisiert: 20. März1 Quellen

TL;DR

Googles Perch 2.0 ist ein Biakustik-Foundation-Model, das ursprünglich auf Millionen von Vogelgesang-Aufnahmen sowie Lauten von Amphibien, Insekten und Säugetieren trainiert wurde. Überraschend: Das Modell erkennt auch Walgesänge zuverlässig – obwohl Unterwasser-Akustik physikalisch völlig anders funktioniert als Luftschall. Google DeepMind und Google Research forschen seit fast zehn Jahren an Wal-Biakustik, darunter Algorithmen für Buckelwal-Rufe und ein Mehrarten-Modell für acht Walspezies.

Nauti's Take

Das klingt nach einem Nebenbefund, ist aber eigentlich der spannendere Teil der Geschichte: Foundation-Models lernen offenbar akustische Strukturen auf einer Abstraktionsebene, die über das Trägermedium hinausgeht. Vögel in der Luft, Wale im Wasser – für das Modell scheint das egal zu sein.

Was für Sprachmodelle schon länger gilt (Transfer über Sprachen und Domänen), gilt jetzt auch für Tierstimmen. Die eigentliche Frage ist, wie weit das geht: Kann ein solches Modell irgendwann auch Erdbebengeräusche, Maschinenlärm oder medizinische Audiosignale klassifizieren?

Die Logik würde es erlauben.

Einordnunganzeigen

Dass ein Modell, das auf Vogelstimmen trainiert wurde, ohne explizites Fine-Tuning auf Walgesänge generalisiert, ist ein starkes Signal für die Reife von Audio-Foundation-Models in der Ökologie. Es bedeutet: Forscher mit kleinen Datensätzen zu seltenen Arten könnten von riesigen, auf häufigere Tiere trainierten Modellen profitieren. Das senkt die Hürde für Biodiversitäts-Monitoring dramatisch – gerade in Ozean-Ökosystemen, wo Datenerhebung teuer und schwierig ist.

Quellen

17.3.26

AI Trained on Birdsong Can Recognize Whale Calls

#google

TL;DR

Nauti's Take

Quellen

Ähnliche Stories

Beiträge aus dem Newsletter