Nach Auffassung der Verwertungsgesellschaft ist dies nicht nur ein Beleg dafür, dass die Werke zu Trainingszwecken verwendet wurden. Vielmehr werden die Daten in das Sprachmodell kopiert und dort gespeichert. Aus Sicht der GEMA handelt es sich dabei um eine unzulässige Vervielfältigung geschützter Kunstwerke – und somit um einen Verstoß gegen das Urheberrecht.
OpenAI beruft sich auf Regelung für Wissenschaft
OpenAI sieht sich – natürlich – völlig zu Unrecht auf der Anklagebank. Die Gewinnung der Trainingsdaten stehe nach Angaben des Unternehmens im Einklang mit dem deutschen Urheberrecht. Bei der Nutzung der Daten beruft man sich auf die Regelungen zu„Text- und Data-Mining für die wissenschaftliche Forschung“. Allerdings ist diese Einschätzung umstritten, denn die Nutzung der Trainingsdaten erfolgt nicht im Rahmen einer wissenschaftlichen Arbeit.
Der Softwareentwickler hinter dem bekannten KI-Assistenten ChatGPT erklärt, dass das Sprachmodell lediglich das auf Basis der Trainingsdaten Erlernte wiedergebe. Das Modell verfügt demnach über keine Datenbank, in die die Daten als Fundus für Fragen der Nutzer aufnehmen könnte. Die Vertreter von OpenAI sehen vielmehr den Nutzer in der Verantwortung, der durch seine Eingabe das vom KI-Assistenten erzeugte Ergebnis hervorruft.
Bewertung von Trainingsdaten im Urheberrecht steht noch aus
Das Besondere an dem Prozess ist nach Ansicht von Silke von Lewinski, Expertin für Urheberrecht bei der Max-Planck-Gesellschaft, dass es sich um ein Musterverfahren handelt. Bisher hat sich noch kein Gericht in der Europäischen Union (EU) mit der Frage befasst, welche rechtlichen Bedingungen für Entwickler von Sprachmodellen bei der Nutzung von Trainingsdaten gelten. Ein finales Urteil könnte sich daher noch länger hinziehen.
Die Entscheidung in dem Verfahren soll am 11. November fallen. Der Verlierer des Prozesses wird jedoch aller Wahrscheinlichkeit nach Revision einlegen. Möglicherweise werden die Richter des Münchner Gerichts den Fall zunächst dem Europäischen Gerichtshof (EuGH) zur Entscheidung vor.
Ich bezweifle, dass KI nur zu Trainingszwecken nutzt. M.E. stellen die Anbieter mit ihrer KI eine Plattform zur Verfügung, mit der es möglich ist, massenhaft zu kopieren und zu vervielfältigen.
Mal sehen, wie das Gericht entscheidet. Viele Songtexte stehen frei verfügbar im Netz, teilweise sogar mit Übersetzung. Gut möglich, dass der Seitenbetreiber dafür Kompensationszahlungen geleistet hat. LLM’s können Internetseiten auswerten. Wenn die KI nichts anderes macht als ein Browser, nämlich den Seiteninhalt wiederzugeben, würde das meiner Meinung nach keine zusätzlichen Ansprüche rechtfertigen und wenn, dann eher von dem oder den Betreiber(n) der Webseite(n). Wenn die das nicht wollen, können sie das in der robots.txt ihrer Seiten vermerken.
"Die Vertreter von OpenAI sehen vielmehr den Nutzer in der Verantwortung, der durch seine Eingabe das vom KI-Assistenten erzeugte Ergebnis hervorruft."
Es nimmt ja teilweise schon absurde Züge an, wie momentan jeder versucht, irgend etwas zu Geld zu machen, das eine KI vielleicht oder vielleicht auch nicht genutzt oder gar gespeichert haben könnte. Mindestens genauso absurd finde ich aber das Gegenargument von OpenAI. Es wird wirklich langsam Zeit für ein paar richtungsweisende Urteile, bevor alle durchdrehen und jeder jeden verklagt.