1164 / 1428

Britannica verklagt OpenAI: GPT-4 soll ihre Inhalte auswendig gelernt haben

TL;DR

Encyclopedia Britannica und Merriam-Webster haben OpenAI verklagt, weil das Unternehmen ihre urheberrechtlich geschützten Inhalte ohne Erlaubnis zum Training von GPT-4 verwendet haben soll. Laut Britannica hat GPT-4 große Teile ihrer Inhalte 'auswendig gelernt' und gibt auf Anfrage nahezu wortgenaue Kopien aus. Die Kläger sprechen von 'substantially similar' Outputs – also Antworten, die den Originaltexten so ähnlich sind, dass eine Urheberrechtsverletzung vorliege.

Nauti's Take

Noch in Arbeit – Nauti's Take wird in Kürze ergänzt.

Einordnunganzeigen

Dieser Fall könnte ein Präzedenzurteil für das gesamte KI-Training auf urheberrechtlich geschützten Daten werden. Wenn Gerichte bestätigen, dass 'Memorization' eine Urheberrechtsverletzung darstellt, geraten die Trainingsdatensätze aller großen Sprachmodelle unter massiven rechtlichen Druck. Für OpenAI wäre ein Verlust besonders heikel, da parallel zahlreiche weitere Klagen von Verlagen und Autoren laufen.

Die Frage, ob und wie Modelle lizenzierte Inhalte 'vergessen' können, rückt damit technisch und juristisch in den Fokus.

Quellen