Gastkommentar: Das Urheberrecht allein reicht in Zeiten von KI nicht aus

Der Fall sorgte für Schlagzeilen: Ende Dezember hat die „New York Times“ (NYT) Microsoft und OpenAI wegen „millionenfacher Urheberrechtsverletzung“ verklagt. Der Vorwurf: Die beklagten Unternehmen hätten ihre jeweilige Künstliche Intelligenz (KI) mit Artikeln, Fotos und sonstigen journalistischen Inhalten der NYT trainiert – ohne deren Zustimmung. Es ist die jüngste und prominenteste einer Reihe von Klagen in den USA, in denen sich Rechteinhaber und KI-Anbieter um Urheberrechte streiten.
>> Lesen Sie hier: Neue Regeln im Kampf um die Rechte der Kreativen
Urheberrecht und KI stehen in einem natürlichen Spannungsverhältnis mit Risiken für alle Beteiligten. Nur wenn diese Risiken vernünftig gemanagt werden, ist eine erfolgreiche Implementierung von KI gewährleistet. Das ist durchaus eine Herausforderung, der sich die wenigsten Unternehmen, die sich erstmalig mit dem Einsatz von KI auseinandersetzen, bewusst sind.
Rein automatisierte Texte, Bilder, Bücher, Fotos oder Songs sind in der Regel nicht schutzfähig
Als personenbezogenes Schutzrecht lässt das Urheberrecht nur für „persönliche geistige Schöpfungen eines Menschen“ Rechte entstehen. Die Frage lautet dann stets: Ist ein Arbeitsergebnis durch eine gestalterische Tätigkeit eines Menschen entstanden? Rein automatisierte, also ohne menschliches Zutun produzierte Texte, Bilder, Bücher, Fotos oder Songs sind in der Regel nicht schutzfähig.
Grundsätzlich gilt: Das Urheberrecht bietet dem Inhaber eine starke Rechtsposition und schützt ihn gegenüber jedem, der seine Werke ohne Erlaubnis nutzt. Wer es dennoch tut, den erwarten Schadenersatz- und Unterlassungsklagen.
Welche urheberrechtlichen Konsequenzen ergeben sich nun für eine Inhalte erstellende KI wie ChatGPT? Und: Welche rechtlichen Gestaltungsmöglichkeiten haben Unternehmen?
Wer diese Fragen beantworten will, muss verstehen, wie eine KI funktioniert: Am Anfang steht ein vom Menschen entwickelter Grundalgorithmus, in den das Herzstück der KI, nämlich das KI-Modell, eingebettet ist. Das KI-Modell entwickelt sich je nach angewendeter Methodik im Wesentlichen autonom aus den Trainingsdaten, mit denen es gespeist wird.
Diese Datenmengen können enorm sein. Der Trainingsdatensatz von ChatGPT besteht aus 300 Milliarden Wörtern und 570 Gigabyte Textdateien – das sind 164.000-mal so viel wie im Gesamtwerk von J.R.R. Tolkien, dem Autor von „Herr der Ringe“. Anhand dieser gigantischen Datenmengen lernt das KI-Modell statistische Eigenschaften von Sprache, also welche Wörter statistisch gesehen am häufigsten in einer Abfolge benutzt werden.
ChatGPT erstellt folglich einen Text über den Bau der alten Pyramiden nicht auf Basis ägyptologischen Wissens, sondern auf Grundlage der in unzähligen Trainings kondensierten Erkenntnisse, welche Wortfolgen statistisch am wahrscheinlichsten sind.
Wenn der KI-Grundalgorithmus nun von einem Menschen entwickelt worden ist, ist er urheberrechtlich geschützt.
Demgegenüber besteht kein Schutz für das eigentliche KI-Modell, wenn sich dieses ohne hinreichendes menschliches Zutun entwickelt. In diesem Fall können KI-Unternehmen Dritten unrechtmäßige Nutzungen auf Basis des Urheberrechtsgesetzes (UrhG) nicht verbieten. Sie können jedoch das Gesetz zum Schutz von Geschäftsgeheimnissen in Anspruch nehmen. Mit ihm werden Informationen geschützt, die allgemein nicht zugänglich sind und aufgrund dieser Exklusivität einen wirtschaftlichen Wert haben. Die Informationen unterliegen meist Geheimhaltungsvereinbarungen mit solchen Geschäftspartnern, die zum Beispiel Zugang zu der KI erhalten.
Trainingsdaten werden oft ohne Erlaubnis des Rechteinhabers aus dem Netz heruntergeladen
Der reine Output einer KI, der nicht von Menschen zusammengestellt ist, hat keinen Schutz nach dem UrhG. Das hat unterschiedliche und manchmal auch fatale Folgen: Während man die unrechtmäßige Nutzung eines per ChatGPT erstellten Social-Media-Posts für die Instagram-Seite eines Unternehmens noch als wirtschaftlich trivial einordnen mag, sieht dies bei einem durch KI erstellten Softwarecode, auf dem ein ganzes Geschäftsmodell fußen soll, schon anders aus. Da Code generierende KI schon bald zu zentralen Produktivitätstreibern werden, sind hier rechtliche Schutzmöglichkeiten dringend geboten.
Trainingsdaten bestehen oft aus urheberrechtlich geschützten Texten, Bildern oder Softwarecode, die ohne Erlaubnis des Rechteinhabers aus dem Internet heruntergeladenen wurden. Die Speicherung solcher Inhalte ist nach dem UrhG eine zustimmungsbedürftige Nutzung. Allerdings: Für Trainingsdaten individuelle Lizenzen vom Rechteinhaber zu erwerben wäre angesichts der erforderlichen Datenmengen ein enormer organisatorischer und finanzieller Aufwand.



Hier kann KI-Entwicklern seit 2019 die „Schrankenbestimmung“ für Text und Data Mining (Paragraf 44b UrhG) helfen. Danach sind Vervielfältigungen von rechtmäßig zugänglich gemachten Werken zum Zwecke einer automatisierten Analyse (wie beispielsweise dem Training einer KI) gesetzlich erlaubt. Das gilt aber nur dann, wenn sich der Rechteinhaber diese Nutzung nicht vorbehalten hat und die Trainingsdaten nach Abschluss des Trainings gelöscht werden.
Der Autor:
Arno Malcher ist Mitgründer und Partner der Münchener Rechtsanwaltskanzlei Wallberg & Cie. Management GmbH.
Mehr: EU beschließt umfangreichstes KI-Gesetz der Welt – das sind die wichtigsten Punkte





