Ein Projekt von:

Institut für Internet-Sicherheit - if(is)

Das Urheberrecht und die KI

Bild eines Stapels Zeitungen

Beitrag teilen:

Um eine effiziente künstliche Intelligenz bereitstellen zu können, ist ein vorheriges Training mit geeigneten Daten erforderlich. Umfassende Modelle verwenden umfangreiche Datensätze, um ein breites Spektrum an Themen und Wissen abzudecken. Die Frage, woher diese Daten stammen und ob bei ihrer Erhebung Urheberrechte verletzt werden, ist von Bedeutung.

OpenAI – einer der größten KI-Hersteller und die Firma hinter ChatGPT und Dall-E – gibt an, ChatGPT mit öffentlich zugänglichen Daten aus dem Internet, lizenzierten Informationen von Drittanbietern und Benutzerinformationen zu trainieren. Der Begriff “öffentlich zugängliche Daten aus dem Internet” schließt jedoch nicht ausschließlich Daten ein, die uneingeschränkt für jegliche Nutzung freigegeben sind. Das Internet enthält eine Fülle von Daten, die dem Urheberrecht unterliegen, darunter Grafiken, Zeitungsartikel, Bücher und vieles mehr.

Klagen gegen KI-Hersteller

Im Dezember reichte die renommierte amerikanische Zeitung New York Times Klage gegen OpenAI und Microsoft wegen Urheberrechtsverletzung ein. Die Zeitung fordert nicht nur Schadenersatz, sondern auch die Vernichtung aller Modelle, die mit ihren Artikeln und Werken trainiert wurden.
Weitere Klagen wurden von der New York Writers’ Union eingereicht, der bekannte Autoren wie John Grisham und George R. R. Martin sowie die Sachbuchautoren Nicholas Basbanes und Nicholas Gage angehören. Diese Autoren beschweren sich über die unerlaubte Nutzung ihrer Werke, insbesondere im Zusammenhang mit der Monetarisierung verschiedener Sprachmodelle.
Im Juni 2023 reichte die Anwaltskanzlei Clarkson ebenfalls eine Klage ein, da die Unternehmen für ihre Modelle auch private Nutzerdaten verwenden. Zu diesen Daten gehören unter anderem Kommentare, Wikipedia-Artikel, Kochrezepte und Blogeinträge – allesamt ohne Einwilligung gesammelt.


Deals mit Verlägen

Dass es auch anders geht, beweist OpenAI mit enormen Lizenzzahlungen an den Axel Springer Verlag. Mit jährlichen Zahlungen in Millionenhöhe erlaubt der Verlag die Nutzung seiner Werke für das Training der KI-Modelle des Unternehmens. Auch andere Verlage gehen inzwischen teure Kooperationen mit dem KI-Hersteller ein. Dieser wird dabei vom Großinvestor Microsoft unterstützt.

Web-Crawler von KI aussperren

Wem das alles nicht reicht, der kann die Webcrawler der KI-Unternehmen blockieren, so dass keine Daten mehr von den einzelnen Webseiten gesammelt werden können.
Diese Maßnahme kann jedoch nur vor zukünftigen Datensammlungen schützen. Informationen, die bereits in die Trainingsdaten eingeflossen sind, können bereits Urheberrechte verletzen und können wahrscheinlich nur durch Klagen und Löschung der gesamten Modelle entfernt werden.

Quellen:
Bild von pixabay