Praktisch jeder, der Texte erzeugt, nutzt heute bereits KI-Tools dafür. Wie passt das mit den aktuellen rechtlichen Rahmenbedingungen zusammen? Eine vielbeachtete Studie von Tim W. Dornis und Sebastian Stober beleuchtet genau diese Frage und die EU hat einen Entwurf zur Regulierung von generativer KI vorgelegt.
Programme wie ChatGPT oder Stable Diffusion erstellen wie von Zauberhand Texte, Bilder oder Musik, die oft verblüffend menschlich wirken. Doch hinter dieser beeindruckenden Technologie stehen komplexe Trainingsprozesse, die auf riesigen Datenmengen basieren – darunter sehr viele urheberrechtlich geschützte Werke.
Inhalt
Was ist Urheberrecht und was schützt es?
Das Urheberrecht ist ein zentraler Bestandteil des geistigen Eigentums und schützt die schöpferische Leistung eines Urhebers. Es verleiht der Person, die ein Werk erschafft, exklusive Rechte an dessen Nutzung und Verwertung. Zu den geschützten Werken gehören unter anderem:
- Literarische Werke (z. B. Bücher, Gedichte, Artikel – auch Texte, die online veröffentlicht wurden).
- Musikalische Kompositionen
- Bildende Kunst (z. B. Gemälde, Skulpturen).
- Fotografien und Filme
- Software sowie
- andere kreative Schöpfungen, sofern sie eine gewisse Schöpfungshöhe erreichen.
Nach § 2 des deutschen Urheberrechtsgesetzes (UrhG) muss ein Werk eine persönliche geistige Schöpfung sein, um Schutz zu genießen. Das bedeutet, dass es individuell und originell sein muss. Reine Fakten oder Daten sind beispielsweise nicht geschützt, da sie keine schöpferische Leistung darstellen.
Umgekehrt bewertet das Urheberrecht aber nicht die Qualität der kreativen Schöpfung: jeder hat grundsätzlich das Recht an seinem eigenen kreativen Werk, egal wie gut oder schlecht das auch sein mag. Allerdings nur dann, wenn es von Menschen selbst erstellt wurde. Ein KI-generiertes Werk ist (bisher) urheberrechtlich nicht geschützt.
Kostenloser SEO-Check für Unternehmen
Füllen Sie meinen Fragebogen aus und erhalten Sie eine gezielte Analyse der Optimierungsmöglichkeiten für Ihr Unternehmen.
Diese Rechte sichern Urhebern nicht nur die Anerkennung ihrer Leistung, sondern auch eine finanzielle Vergütung, wenn ihr Werk genutzt wird. Darauf basiert die gesamte Kreativbranche von Designern über Filmemacher, Autoren oder Komponisten.
Was sind generative KI-Modelle und wie funktionieren sie?
Generative KI-Systeme sind so programmiert, dass sie eigenständig neue Inhalte erschaffen. Dabei lernen sie aus vorhandenen Daten, wie Sprache aufgebaut ist, wie ein Bild gezeichnet oder wie ein Musikstück komponiert wird. Diese Daten stammen häufig aus dem Internet, darunter Texte, Bilder und Videos. Fast alle dieser Inhalte sind jedoch automatisch urheberrechtlich geschützt, was zu Konflikten führt.
Ein Beispiel: Um ein System wie ChatGPT zu trainieren, werden große Mengen an Texten verarbeitet. Diese Texte werden analysiert und „gelernt“, damit das KI-System selbständig schreiben kann. Dabei entstehen keine exakten Kopien der Trainingsdaten, sondern neue Inhalte. Dennoch bleiben Fragestellungen offen: Kann die Nutzung urheberrechtlich geschützter Texte im Training als rechtlich unbedenklich gelten?
Urheberrechtliche Herausforderungen
Die Studie zeigt, dass das Training generativer KI-Modelle oft im Konflikt mit dem Urheberrecht steht. Hier sind die wichtigsten Punkte:
- Vervielfältigung geschützter Inhalte
Laut § 16 Abs. 1 des Urheberrechtsgesetzes (UrhG) handelt es sich um eine urheberrechtlich relevante Vervielfältigung, wenn geschützte Werke während des Trainingsprozesses genutzt und gespeichert werden – selbst wenn diese später nicht direkt sichtbar sind. Die Autoren betonen: „Auch die Speicherung ‚im Innern‘ eines Modells stellt eine relevante Vervielfältigung dar.“ - Fehlende rechtliche Ausnahmen
Viele dieser Vorgänge könnten durch rechtliche Schranken abgedeckt sein, z. B. durch die Ausnahmen für Text- und Data-Mining (§ 44b UrhG). Allerdings zeigt die Studie, dass diese Regelungen nicht auf die komplexen Prozesse des KI-Trainings anwendbar sind. Der Grund: Beim Training generativer KI-Modelle werden nicht nur semantische Informationen (also der Sinn eines Textes), sondern auch syntaktische Strukturen verarbeitet und „gelernt“.
„Das Training generativer KI-Modelle nutzt nicht nur semantische Informationen, sondern verwertet auch syntaktische Strukturen, die urheberrechtlich geschützt sein können. Das geht weit über die Schranke des Text- und Data-Mining hinaus.“ - Zugänglichmachung der Modelle
Werden trainierte KI-Modelle öffentlich bereitgestellt, können sie dazu genutzt werden, ähnliche Inhalte wie die Trainingsdaten zu erstellen. Diese indirekte Nutzung geschützter Werke stellt eine weitere rechtliche Herausforderung dar.
„Die Zurverfügungstellung generativer KI-Modelle an die Öffentlichkeit kommt einer öffentlichen Zugänglichmachung der im Training genutzten Werke gleich.“
Globale Dimensionen
Der Konflikt um Urheberrecht und KI ist kein rein deutsches Thema. In den USA und Großbritannien sind bereits zahlreiche Klagen anhängig, die sich auf die Nutzung geschützter Inhalte im KI-Training beziehen. Europäische Gesetze, wie die kürzlich verabschiedete KI-Verordnung, versuchen, diese Fragen zu regeln. Doch auch hier bestehen Lücken.
Die Studie warnt: „Ein unregulierter Einsatz generativer KI führt zu einem globalen ‚race to the bottom‘, bei dem Urheberrechte zunehmend ausgehebelt werden.“
Mögliche Lösungen
Die Autoren fordern klare Regelungen, um den Einsatz von KI mit dem Urheberrecht in Einklang zu bringen. Einige Ansätze könnten sein:
- Lizenzmodelle für Trainingsdaten: Rechteinhaber könnten eine Vergütung erhalten, wenn ihre Werke im KI-Training genutzt werden. Allerdings gibt es wohl kein Geschäftsmodell, dass den Anbietern eine Vergütung von Milliarden Urhebern im Web sinnvoll ermöglichen könnte. ChatGPT arbeitet nun zwar bereits mit ersten Verlagen wie Springer, das ist aber nur die Spitze des Eisbergs.
- Transparenzpflichten: Unternehmen sollten offenlegen, welche Daten sie zum Training verwenden. Das ist bei KI-Suchmaschinen schon der Fall, Seiten, deren Inhalte dort ungefragt auftauchen hätten also theoretisch schon die Möglichkeit, rechtlich dagegen vorzugehen.
- Technologische Innovationen: Neue Verfahren könnten es ermöglichen, geschützte Inhalte zu umgehen und trotzdem hochwertige Modelle zu trainieren, um sie zum Beispiel als Textassistenten zu verwenden. Generative KI als Suchmaschine basiert hingegen auf geschützten Inhalten und muss deshalb grundsätzlich in Frage gestellt werden.
Warum ist das wichtig?
Generative KI hat das Potenzial, die Kreativwirtschaft zu unterstützen und neue Geschäftsmodelle und Produkte hervorzubringen. Doch wenn die Rechte der Urheber ignoriert werden, könnten Kreative langfristig geschädigt werden. Es ist wichtig, ein Gleichgewicht zu finden, das sowohl Innovation als auch die Rechte der Urheber schützt. Eine Lösung könnte sein, KI nicht mehr als Allerweltstool für alle möglichen Anwendungen auf den Markt zu bringen, sondern in Produkte zu integrieren, die den rechtlichen Anforderungen genügen.
Der Anbieter you.com geht bereits in diese Richtung und nennt sein KI-Tool “Produktivitätsmaschine”, allerdings verwendet es dann am Ende auch nur im Netz verfügbares Halbwissen, was das Versprechen echter Produktivitätssteigerung bisher nicht hält. Denn das Prüfen von KI-Inhalten kostet sehr viel Zeit, wenn man es für geschäftliche Zwecke und rechtlich wasserdichte Prozesse verwenden möchte.
EU veröffentlicht einen Entwurf zum Verhaltenskodex für generative KI
Mit dem KI-Gesetz, das seit August 2024 in Kraft ist, und dem geplanten Verhaltenskodex für General-Purpose-KI (GP-KI), der von unabhängigen Experten in einem ersten Entwurf vorgelegt wurde, definiert die EU Leitplanken, um KI sicher und rechtskonform einzusetzen. Der Entwurf wird in den nächsten Wochen von über 1000 Stakeholdern diskutiert.
Die wichtigsten Punkte des Papiers:
1. Transparenz: Dokumentation ist entscheidend
- Unternehmen, die KI-Modelle nutzen oder integrieren, müssen künftig auf detaillierte technische Dokumentationen der Anbieter achten.
- Informationen über die Fähigkeiten und Grenzen der eingesetzten KI-Modelle sind unerlässlich, um Risiken zu minimieren und regulatorische Anforderungen zu erfüllen.
2. Urheberrecht und Datenquellen
- Die Einhaltung des Urheberrechts wird stärker reguliert. Anbieter müssen sicherstellen, dass ihre Trainingsdaten legal genutzt werden.
3. Umgang mit Risiken: Sicherheit im Fokus
Die EU definiert potenzielle Risiken, die durch KI entstehen können, darunter:
- Manipulation und Desinformation: Modelle könnten für großflächige Manipulationen oder unethische Zwecke eingesetzt werden.
- Diskriminierung: Algorithmen könnten unfaire oder voreingenommene Entscheidungen treffen.
- Kontrollverlust: Es besteht die Gefahr, dass KI-Modelle unvorhersehbare Entscheidungen treffen.
4. Governance und Verantwortung
- Unternehmen sollten sicherstellen, dass Verantwortlichkeiten für den Einsatz von KI klar definiert sind.
- Anbieter von KI-Modellen werden verpflichtet, interne Mechanismen wie Sicherheits- und Risikoberichte sowie Vorfallsmeldungen einzuführen.
5. Transparenz und Zusammenarbeit
- Unternehmen müssen künftig mehr Transparenz über den Einsatz von KI-Modellen schaffen.
- Anbieter werden verpflichtet, Sicherheitsberichte und relevante Dokumentationen bereitzustellen, die auch Ihnen helfen können, Risiken besser zu verstehen.
6. Was bringt die Zukunft?
Der geplante Verhaltenskodex wird bis Mai 2025 weiterentwickelt. Es ist zu erwarten, dass:
- Anbieter von KI-Modellen höhere Anforderungen an Sicherheit, Dokumentation und Risikoüberwachung erfüllen müssen.
- Unternehmen als Nutzer von KI ebenfalls mehr Verantwortung für den sicheren Einsatz übernehmen müssen.
Fazit: Ohne Regulierung profitieren nur die KI-Unternehmen
Die Studie von Dornis und Stober sowie der Entwurf für eine Regulierung von KI-Anbietern macht deutlich, dass wir uns in einer kritischen Phase der Regulierung von Künstlicher Intelligenz befinden. Ohne klare Regeln drohen Rechtsverletzungen und ein unfairer Wettbewerb zulasten von Kreativen. Die Herausforderung besteht darin, rechtliche und technologische Lösungen zu finden, die den Fortschritt der KI ermöglichen und gleichzeitig die Rechte derjenigen schützen, die den Grundstein dafür legen: die Urheber.
Quellen:
Urheberrecht und Training generativer KI-Modelle – Technologische und juristische Grundlagen
First Draft General-Purpose AI Code of Practice
Kontakt
Sie brauchen zuverlässige Unterstützung zum Thema Suchmaschinenoptimierung und Content? Fragen Sie nach einer unverbindlichen Erstberatung mit kostenlosem SEO-Check Ihrer Website.