Copyright-Klagen gegen OpenAI von The Intercept und Raw Story

OpenAI habe seine Large Language Models (LLM) gezielt dazu programmiert, Quellenangaben zu löschen. Diesen Vorwurf erheben drei US-Medien in zwei neuen Klagen.​

In Pocket speichern vorlesen Druckansicht 20 Kommentare lesen
Weißes Copyright-Symbol

(Bild: MR Gao/Shutterstock.com)

Lesezeit: 3 Min.

The Intercept, AlterNet und Raw Story verklagen OpenAI wegen Verletzung des Digital Millennium Copyright Act vor einem US-Bundesbezirksgericht. Es geht um urheberrechtlich geschützte Inhalte, die OpenAI zum Training von GPT genutzt hat, ohne eine Genehmigung der Rechteinhaber einzuholen. Doch im Unterschied zur prominenten Klage der New York Times gegen OpenAI stützen sich die neuen Klagen nur auf einen Teilaspekt: Die Unterschlagung von Titel, Urheber und Copyright des jeweils genutzten Werks.

Der Digital Millennium Copyright Act verbietet, sogenannte Copyright Management Information von einem Werk zu verändern oder zu entfernen, wenn der Rechteinhaber dem nicht zugestimmt hat. Die Kläger verweisen auf eine Erhebung der Webseite Copyleft, die bei 60 Prozent der Ausgaben von GPT 3.5 Plagiate gefunden hat. Mehr als 45 Prozent der enthaltenen Texte seien identische Kopien fremder Werke gewesen. Allein: Es fehlten jegliche Angaben zu Copyright, Urheber und Titel dieser fremden Werke – die rechtlich erforderliche Copyright Management Information.

Während die Klage der New York Times auch die Vorwürfe erhebt, dass OpenAI die fremden Werke ohne Lizenz gar nicht hätte kopieren dürfen, und ohne Lizenz nicht veröffentlichen darf, konzentrieren sich The Intercept, AlterNet und Raw Story einzig und allein auf die Unterschlagung der fehlenden, aber vorgeschriebenen Angaben. Diese würden nicht bloß in der Ausgabe fehlen, sondern OpenAI habe sie gezielt aus den Trainingsdaten entfernt, noch bevor sie für das Training der Large Language Models genutzt wurden.

The Intercept hat zusätzlich auch Microsoft verklagt und erhebt drei weitere Vorwürfe, die sich ebenfalls auf Copyright Management Information beziehen: Nicht nur OpenAI habe die Angaben aus Werkkopien entfernt, die dann für KI-Training genutzt wurden, sondern auch Microsoft. Außerdem habe Microsoft solcherart verkürzte Trainingsdaten an OpenAI weitergegeben, und umgekehrt. Und die Weitergabe ohne Copyright Management Information ist ein eigener Tatbestand im Digital Millennium Copyright Act.

Ansonsten ähneln sich die Klagen von AlterNet und Raw Story einerseits und The Intercept andererseits sehr. Pro Verletzung fordern die Kläger mindestens 2,500 US-Dollar Schadenersatz (gut 2.300 Euro). Außerdem beantragen sie Unterlassungsverfügungen und Ersatz ihrer Anwalts- und Verfahrenskosten.

Die Verfahren heißen The Intercept Media v OpenAI, Microsoft et al (Az. 24-cv-01515) sowie Raw Story Media et Alternet Media v OpenAI (Az. 24-cv-01514) und wurden beide am 28. Februar beim US-Bundesbezirksgericht für das Südliche New York eingebracht. Die Kläger begehren einen Prozess mit Geschworenen, was in den USA auch bei zivilrechtlichen Verfahren möglich ist.

(ds)