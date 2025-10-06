Nun hat die Gesellschaft für musikalische Aufführungs- und mechanische Vervielfältigungsrechte (GEMA) vor dem Landgericht München Klage gegen OpenAI erhoben. Bei einer Prüfung im vergangenen Jahr fiel auf, dass der Entwickler die Liedtexte von mindestens neun der vertretenen Künstler zum Training seiner KI verwendete. Die GEMA wurde über die Verwendung weder informiert, noch wurde eine Kompensation angeboten. Darüber hinaus wurden die Texte wurden vom Chat-Assistenten ChatGPT nach der Eingabe einfacher Prompts größtenteils im Original wiedergegeben.

Nach Auffassung der Verwertungsgesellschaft ist dies nicht nur ein Beleg dafür, dass die Werke zu Trainingszwecken verwendet wurden. Vielmehr werden die Daten in das Sprachmodell kopiert und dort gespeichert. Aus Sicht der GEMA handelt es sich dabei um eine unzulässige Vervielfältigung geschützter Kunstwerke – und somit um einen Verstoß gegen das Urheberrecht.

OpenAI beruft sich auf Regelung für Wissenschaft

OpenAI sieht sich – natürlich – völlig zu Unrecht auf der Anklagebank. Die Gewinnung der Trainingsdaten stehe nach Angaben des Unternehmens im Einklang mit dem deutschen Urheberrecht. Bei der Nutzung der Daten beruft man sich auf die Regelungen zu„Text- und Data-Mining für die wissenschaftliche Forschung“. Allerdings ist diese Einschätzung umstritten, denn die Nutzung der Trainingsdaten erfolgt nicht im Rahmen einer wissenschaftlichen Arbeit.

Der Softwareentwickler hinter dem bekannten KI-Assistenten ChatGPT erklärt, dass das Sprachmodell lediglich das auf Basis der Trainingsdaten Erlernte wiedergebe. Das Modell verfügt demnach über keine Datenbank, in die die Daten als Fundus für Fragen der Nutzer aufnehmen könnte. Die Vertreter von OpenAI sehen vielmehr den Nutzer in der Verantwortung, der durch seine Eingabe das vom KI-Assistenten erzeugte Ergebnis hervorruft.

Bewertung von Trainingsdaten im Urheberrecht steht noch aus

Das Besondere an dem Prozess ist nach Ansicht von Silke von Lewinski, Expertin für Urheberrecht bei der Max-Planck-Gesellschaft, dass es sich um ein Musterverfahren handelt. Bisher hat sich noch kein Gericht in der Europäischen Union (EU) mit der Frage befasst, welche rechtlichen Bedingungen für Entwickler von Sprachmodellen bei der Nutzung von Trainingsdaten gelten. Ein finales Urteil könnte sich daher noch länger hinziehen.

Die Entscheidung in dem Verfahren soll am 11. November fallen. Der Verlierer des Prozesses wird jedoch aller Wahrscheinlichkeit nach Revision einlegen. Möglicherweise werden die Richter des Münchner Gerichts den Fall zunächst dem Europäischen Gerichtshof (EuGH) zur Entscheidung vor.