By Vincent M. Kästle und Tobias Wolfenstätter

 

Teil 1: Input bzw. KI-Training

Fast keine Woche vergeht, ohne dass eine aufsehenerregende Klage gegen einen Anbieter von Künstlicher Intelligenz (KI) durch die Medien geht.[1] Viele dieser Klagen sind auf dem Gebiet des geistigen Eigentums und richten sich gegen solche Arten von KI, die in der Lage sind, bestimmte Inhalte wie Texte, Bilder, Musik usw. zu generieren (sog. generative KI). Meist stehen dabei urheberrechtliche Fragen im Fokus. Einerseits geht es um den Output solcher KI-Modelle: Ist ein computer-generiertes Erzeugnis urheberrechtsfähig? Wann verletzt ein computer-generiertes Erzeugnis das Urheberrecht von bereits bestehenden menschlichen Werken und wer haftet dafür? Andererseits geht es aber auch um den Input generativer KI-Modelle in Form der Trainingsdaten, die für die Programmierung der KI verwendet wurden. Für das Training muss die KI mit Milliarden, oft sogar mit Billionen von existierenden Werken gefüttert werden. Viele der menschlichen Schöpfer sehen sich durch die ungefragte Verwendung ihrer Werke für das Training in ihren Urheberrechten verletzt. Letztlich geht es den Schöpfern der Trainingsdaten aber um noch mehr: Ist nicht gar die Existenz des menschlichen Künstlers bedroht, wenn man per Mausklick den Stil eines jeden Künstlers so nachahmen kann, dass das menschliche Auge das computergenerierte Erzeugnis nicht mehr von dem originalen Werk des Künstlers unterscheiden kann?

Weil sich viele der Klagen in den USA abspielen, wo auch viele generative KI-Modelle entwickelt werden, lohnt der Blick über den Atlantik. Neben einigen Massenklageverfahren von einzelnen Künstlern erregte die Klage von Getty Images gegen Stability AI am meisten Aufsehen.[2] Der folgende Beitrag versucht, die dort angelegten urheberrechtlichen Probleme sowohl aus deutscher als auch aus amerikanischer Sicht zu beleuchten. Aus der Reihenfolge von “Input & Output” bzw. “Training & Benutzung der KI” ergibt sich dabei eine Zweiteilung der Untersuchung. Der erste Teil behandelt die urheberrechtlichen Rechtsfragen rund um die Programmierung von generativer KI. Der zweite Teil wird dann auf Fragen rund um die Erzeugnisse, die von der KI durch Benutzereingaben generiert werden, eingehen.

Getty Images (US), Inc. v. Stability AI, Inc.

Stability AI ist das Unternehmen, das maßgeblich an der Entwicklung der Bildgenerator-KI Stable Diffusion beteiligt ist. Als Text-zu-Bild-Generator ist Stable Diffusion in der Lage, selbständig Bilder basierend auf Texteingaben des Nutzers zu erzeugen. Gibt man beispielsweise ein: “Photo-realistic giraffe underwater”, so generiert Stable Diffusion in der Tat ein realistisch aussehendes Foto einer Giraffe, die über den Meeresboden spaziert.[3]

In technischer Hinsicht ist die Feststellung bedeutsam, dass es sich dabei nicht nur um eine bloße Collage handelt.[4] Stable Diffusion hat nicht mit geschickten “Photoshop”-Fähigkeiten das Foto einer Giraffe auf den Hintergrund des Meeresbodens gesetzt. Stable Diffusion hat vielmehr mithilfe ausgeklügelter Algorithmen und Zufallsparameter ein völlig eigenständiges Bild geschaffen, das es vorher so noch nicht gab. Das zeigt sich besonders an den kleineren Fehlern, die sich immer noch ins Bild schleichen. Hier sind es zum Beispiel die eigenartig spitzen Höcker auf dem Rücken der Giraffe.

Machine Learning und Natural Language Processing

Die Technik, die solche Anwendungen ermöglicht, ist das maschinelle Lernen (Machine Learning) sowie die maschinelle Sprachverarbeitung (Natural language processing). Auch wenn in diesem Beitrag keine ausführliche Erklärung der beiden Techniken geliefert werden kann,[5] ist es wichtig, das technisch revolutionäre Grundprinzip vom Machine Learning zu verstehen. Machine Learning beschreibt die Art und Weise, wie eine KI ihre Fähigkeiten erwirbt. Anders als früher ist es nicht mehr der menschliche Programmierer, der alles, was ein Computerprogramm können soll, mit tausenden Zeilen Code beschreiben muss, sondern es ist die KI, die sich eigenständig bestimmte Funktionen aneignet. Im Bereich der Bilderkennung muss zum Beispiel der Programmierer nicht mehr manuell vorgeben, dass eine Giraffe üblicherweise einen sehr langen Hals hat und auf ihrem Fell dunkle Flecken vor einem hellen Hintergrund. Die KI wird durch maschinelles Lernen diese Erkenntnis selbständig erwerben, wenn man ihr nur genug Bilder von Giraffen zeigt und diese auf wiederkehrende Muster untersuchen lässt. Für dieses sog. Training ist neben viel Rechenleistung auch enorm viel Trainingsmaterial erforderlich. Je mehr Trainingsmaterial man einer KI zeigt, desto präziser und vielfältiger sind die gewonnenen Erkenntnisse. Für den Bildgenerator Stable Diffusion hat man zum Beispiel den Trainingsdatensatz LAION-5B verwendet, der 5 Milliarden Bild-Text-Paare beinhaltet.[6]

Urheberrechtlicher Schutz von öffentlich zugänglichen Bildern im Internet

Das entscheidende Problem im Fall von Getty Images v. Stability AI ist aber, woher diese 5 Milliarden Bilder mit dazugehörigem Text stammen. Erstellt hat den LAION-5B Datensatz der deutsche Verein LAION gemeinnütziger e.V., der wiederum zu einem Teil von Stability AI finanziert wird.[7] Die Bilder stammen aus den Weiten des Internets. Der Begriff “Common Crawl” beschreibt die Methode, mithilfe derer LAION quasi das gesamte öffentlich zugängliche Internet durchforstet und Links (URLs) zu Bildern zusammengetragen hat. Allein der deutschsprachige Wikipedia-Artikel zur Giraffe zeigt beispielsweise über zehn Fotos von Giraffen mit dazugehörigen Beschreibungen. Eine schier unendliche weitere Zahl Bilder kann man über die Google-Bildersuche sehen. Dabei sind die meisten Bilder, auf die man stößt, urheberrechtlich geschützt.

Das ist der Anknüpfungspunkt der Klage von Getty Images, einer amerikanischen Bildagentur, die über 80 Millionen Bilder und Illustrationen zur Lizenzierung anbietet. Auf ihrer Website präsentiert Getty Images dabei jeweils ein durch Wasserzeichen geschütztes Vorschaubild sowie eine dazugehörige Beschreibung. Es scheint unbestritten zu sein, dass ca. 12 Millionen dieser Bilder sich im Datensatz von LAION befinden und deshalb von Stability AI zum Training der Stable Diffusion KI verwendet wurden. Getty Images sieht sich nun in seinen Rechten an den Bildern verletzt. Schwerpunktmäßig geht es um eine Verletzung der Verwertungs- und Vervielfältigungsrechte. Daneben macht Getty Images noch eine markenrechtliche Verletzung in Bezug auf die Wasserzeichen geltend, um die es hier nicht gehen soll. In anderen ähnlich gelagerten Fällen geht es außerdem um noch um datenschutzrechtliche Probleme, insoweit die Trainingsbilder persönliche Daten beinhalten.[8]

Inhalt und Schranken des Urheberrechts

Warum die Klage sich nicht gegen LAION richtet, ist dadurch zu erklären, dass der angebotene Datensatz nicht selbst die Bilder enthält, sondern nur Verweisungen auf die Bilder in Form von URLs. LAION bietet also keine Kopien von Bildern an, sondern stellt letztlich nur die Information zur Verfügung, wie man zu einem öffentlich zugänglichen Bild gelangen kann. Folgt ein Mensch einem solchen Link und betrachtet das Bild, so liegt nach allgemeinem Verständnis keine Urheberrechtsverletzung vor. Noch aus der analogen Welt stammt die traditionelle Konzeption des Urheberrechts, dass der schlichte Werkgenuss als solcher gemeinfrei ist.[9] Der Schutz des Urhebers knüpft vielmehr an vorgelagerte Handlungen an, die für den Genuss des Werkes erforderlich sind. So ist die unerlaubte Vervielfältigung eines Werks rechtswidrig, der bloße Besitz einer rechtswidrig erstellen Kopie allerdings nicht. Übertragen auf die Welt des Internets bedeutet dies, dass die reine Betrachtung eines Bildes im öffentlichen Teil des Internets zulässig ist, die Anfertigung einer Kopie allerdings nicht. Eine wichtige Ausnahme sind reine sog. Privatkopien iSd § 53 UrhG, deren Anwendung aber im Fall kommerziell angebotener KI-Systeme ausscheidet.

Nun mag man einwenden, dass aus technischen Gründen durchaus Vervielfältigungen des Bildes erforderlich sind, um es auf dem eigenen Computer-Bildschirm anschauen zu können. Zur Darstellung des Bildes im Browser wird zum Beispiel eine Kopie des Bildes im schnellen Zwischenspeicher des Computers (Cache) angefertigt. Für diese Fälle finden sich aber sowohl im europäischen als auch im amerikanischen Recht bestimmte Schrankenregelungen. Art. 5 InfoSoc-RL bzw. § 44a UrhG erklären solche Vervielfältigungen für zulässig, die aus primär technischen Zwecken vorübergehend notwendig sind und keine eigenständige wirtschaftliche Bedeutung haben. Im amerikanischen Urheberrecht finden sich in 17 U.S. Code § 512 sehr ähnliche Schranken für das Caching.

Weil diese expliziten Schrankenregelungen angesichts ihres technischen Bezugs relativ eng gefasst sind, kam es in der Vergangenheit oft zu problematischen Fallgruppen, bei denen auf andere Schranken zurückgegriffen werden musste. So erklärte der BGH § 44a UrhG für nicht anwendbar auf die Vorschaubilder (Thumbnails) bei Google Bilder, weil sie dauerhaft angezeigt werden würden und für Google erhebliche wirtschaftliche Bedeutung haben.[10] Um trotzdem zur Zulässigkeit der Darstellung von Vorschaubildern zu gelangen (letztlich weist Google dem Nutzer lediglich den Weg zu einem Originalbild), musste der BGH die Rechtsfigur der schlichten Einwilligung erfinden.[11] Der Rechtsinhaber sei mit dem Einstellen seiner Bilder in das öffentlich zugängliche Internet mit der Anzeige von Vorschaubildern auf Bildersuchmaschinen einverstanden.

Fair-use-Schranke in den USA

In den USA konnte man diesen Fall unkomplizierter lösen, da mit der sog. Fair-use-Schranke eine generalklauselartige Schranke zur Verfügung steht. Kodifiziert in 17 U.S. Code § 107 setzt fair use die Abwägung von vier Faktoren voraus, um die Zulässigkeit einer urheberrechtlichen Verletzungshandlung zu bestimmen:

(1) the purpose and character of the use, including whether such use is of a commercial nature or is for nonprofit educational purposes;

(2) the nature of the copyrighted work;

(3) the amount and substantiality of the portion used in relation to the copyrighted work as a whole; and

(4) the effect of the use upon the potential market for or value of the copyrighted work.

Alle vier Faktoren müssen beurteilt und zueinander ins Verhältnis gesetzt werden. Zum Beispiel hatte in den 1990er Jahren der Computerspiele-Hersteller Sega gegen den Spieleanbieter Accolade geklagt, weil dieser den Quellcode von Segas Spielen mithilfe sog. “reverse engineering” geknackt hatte, um kompatible Spiele herauszubringen.[12] Der dritte Faktor wog schwer gegen Accolade, weil der gesamte Quellcode von Segas Spielen kopiert werden musste und in großen Teilen übernommen worden war. Der United States Court of Appeals for the Ninth Circuit befand gleichwohl, dass das Vorgehen von Accolade der Fair-use-Schranke unterfiel, weil Accolade den Quellcode nur kopierte und modifizierte, um Kompatibilität zu erreichen. Das ist ein Zweck der Nutzung, der insbesondere dem ersten und vierten Faktor so zugutekam, dass die starke Bedeutung des dritten Faktors überwogen war. An diesem Beispiel zeichnet sich bereits ab, dass der Zweck der beabsichtigten Nutzung, also der erste Faktor, anscheinend ein ganz wesentliches Kriterium ist. Das Schlagwort, unter dem dieses Phänomen in der amerikanischen Rechtswissenschaft diskutiert wird, ist sog. transformative use. Haben sich 1991 noch gerade einmal 8% der Fair-use-Entscheidungen auf transformative use gestützt, so waren es in 2019 schon ca. 90%.[13] Eine bestimmte Nutzung ist nach den Grundsätzen von transformative use dann zulässig, wenn das Original nur als “raw material, transformed in the creation of new information, new aesthetics, new insights and understandings”[14] verwendet wird. Verwendet das angestrebte Erzeugnis das Original nur als Grundlage, verfolgt aber hinreichend unterschiedliche Zwecke, so wahrt es hinreichenden Abstand und ist folglich zulässig.

Dies zeigt sich besonders anschaulich im Fall der Vorschaubilder, wo transformative use der ausschlaggebende Gedanke war: Während die im Internet hochgeladenen Original-Bilder dem United States Court of Appeals for the Ninth Circuit zufolge “entertainment, aesthetic, or informative” Zwecke erfüllen, fungieren die Vorschaubilder – wie oben angedeutet – lediglich als “pointer directing a user to a source of information.”[15] Interessanterweise vermischen sich jetzt hier die zwei Schritte von Informationsgewinnung und -weiterverarbeitung. Die Verletzung von Urheberrechten hängt maßgeblich davon ab, was der Verletzer mit den Daten vorhat. Letztlich kann ein Zweck die Mittel heiligen, wenn er nur “anders genug” erscheint, wobei sogar eine gewisse gesellschaftliche Relevanz des Nutzungszwecks miteinbezogen zu werden scheint (vgl. den ebenfalls für fair-use erklärten Fall von Google Books[16]). Inhaltlich kann man mit der Auslegung in diesen Fällen wohl gut mitgehen. Weil damit aber im Ergebnis die urheberrechtliche Zulässigkeit bestimmter Handlungen von einem durchaus als diffus zu beschreibenden Gefühl der “fairness” der Nutzung abhängt, wird die Fair-use-Schranke nicht zu Unrecht oft als unvorhersehbar kritisiert.[17]

Übertragung auf das Training von KI

Vor diesem Hintergrund lässt sich das “Ansehen” der Bilder während des KI-Trainings einordnen: Der isolierte Vorgang der Bildbetrachtung durch einen Computer entspricht dem Werkgenuss eines Menschen und ist damit nicht urheberrechtlich relevant.[18] Entscheidend ist eher, ob das zwingend vorgelagerte Herunterladen und Laden des Trainingsmaterials in den Arbeitsspeicher des Computers (RAM) unter eine urheberrechtliche Schranke subsumiert werden kann. In Deutschland gibt es mit den §§ 44b, 60d UrhG explizite Schranken für sog. Text und Data Mining.[19] Demnach sind gem. § 44b Abs. 2 S. 1 UrhG Vervielfältigungen von rechtmäßig zugänglichen Werken für Text und Data Mining zulässig. Text und Data Mining ist gem. § 44b Abs. 1 UrhG dabei die automatisierte Analyse von Werken, um daraus Informationen zu gewinnen. Obschon man bei spitzfindiger Auslegung monieren könnte, dass das Herunterladen der Bilder aus dem Internet noch nicht selbst der Informationsgewinnung dient, sondern nur Vorbereitungsakt für das spätere KI-Training ist, ist die Vorschrift mindestens teleologisch so auszulegen, dass die Vervielfältigungen “für” Text und Data Mining auch vorbereitende Downloads umfassen. Die §§ 44b, 60d UrhG gehen auf die sog. DSM-Richtlinie zurück, die in den Erwägungsgründen explizit die Förderung von Innovation als Ziel benennt. § 44b Abs. 3 UrhG sieht außerdem einen sog. Opt-Out-Mechanismus vor, wonach der Rechtsinhaber sich die exklusiven Vervielfältigungsrechte für Zwecke des Text und Data Minings vorbehalten kann, sofern der Vorbehalt in maschinenlesbarer Form erfolgt. Denkbar ist hier die Erstellung einer simplen sog. robot-txt.-Datei im Verzeichnis der Website, oder ein Verweis im Impressum oder in den AGB, die den Web-Crawlern aufzeigt, seine Werke nicht zum Text oder Data Mining zur Verfügung stellen zu wollen.[20] Äußert der Rechtsinhaber diesen Vorbehalt, so können die Vervielfältigungen gleichwohl gem. § 60d Abs. 1 UrhG auch ohne dessen Zustimmung zulässig sein, wenn das Text und Data Mining für Zwecke der wissenschaftlichen Forschung erfolgt. Die Rechtslage scheint damit für KI-Training in Deutschland verhältnismäßig klar zu sein: Solche Werke dürfen verwendet werden, die keinen Vorbehalt des Rechtsinhabers aufweisen; für wissenschaftliche Zwecke ist die Nutzbarkeit sogar unabhängig vom Vorliegen eines Vorbehalts gegeben.[21]

Weil Stability AI mit seinem KI-Training wohl gute Chancen hat, diese Schrankenregelung zu erfüllen, beantragte das Unternehmen vor kurzem die Verlegung der Klage von den USA nach Großbritannien, wo es seinen offiziellen Firmensitz hat.[22] Dort soll laut Stability AI das KI-Training stattgefunden haben. Hintergrund ist wohl die Tatsache, dass Großbritannien ähnlich liberale Schrankenregelungen aufweist wie die Europäische Union. Zwar gilt die dortige Text und Data Mining Schranke aktuell nur für “non-commercial purposes”, die Britische Regierung hat aber bereits angekündigt, um seine Position im Standortwettbewerb um KI zu verbessern, diese auf alle Nutzungszwecke ausweiten zu wollen.[23]

In den USA ist die Situation mit der allgemein formulierten Fair-use-Schranke dagegen wesentlich schlechter vorhersehbar.[24] Anders als bei den eher technikbezogenen klar subsumierbaren europäischen Schrankenregelungen, wird in den USA mit transformative use noch stärker der verfolgte kommerzielle Zweck in den Blick genommen mit seinen Auswirkungen auf die Lizenz-Märkte. Hier scheint sich mittlerweile eine Praxis abzuzeichnen, wonach viele KI-Entwickler freiwillig Lizenzverträge mit Anbietern großer Datenmengen abschließen. Zum Beispiel hat die Bildagentur Shutterstock einen Sechs-Jahres-Vertrag mit dem KI-Entwickler OpenAI über die Zurverfügungstellung von Trainingsdaten geschlossen.[25] Die von Adobe entwickelte generative KI “Firefly” wirbt damit, nur mit explizit lizenzierten oder Open-Access Trainingsdaten programmiert worden zu sein.[26] Die Nachrichtenagentur Associated Press vermarktet ihr ca. 40-jähriges Textarchiv für KI-Training.[27] Das könnte dazu führen, dass die amerikanischen Gerichte Stability AI als Freerider sehen, obwohl nach juristischer Auslegung ein transformative use vorzuliegen scheint.[28] Die Verwendung von Bildern als reines Anschauungs- bzw. Inspirationsmaterial scheint geradezu ein Musterbeispiel für jenes “raw material” zu sein, welches in vielen weiteren Schritten durch die KI zu völlig neuen Kreationen transformiert wird.

Der Ausgang der Klage wird also maßgeblich von der Gewichtung des kommerziellen Aspekts abhängen. Es ist nicht von der Hand zu weisen, dass Bildagenturen wie Getty Images mit generativen KI-Systemen, die fotorealistische Bilder erzeugen können, in direkter Konkurrenz stehen. Die Frage nach der freien Nutzbarkeit von urheberrechtlichen Bildern für KI-Training ist deshalb letztlich als das entscheidende Spielfeld zu sehen, auf dem um die Verteilung von Kosten und Nutzen generativer KI gestritten wird. Legt man die Fair-use-Schranke eng aus, so könnte das dazu führen, dass nur noch große und finanzstarke Unternehmen sich die Finanzierung von großen Sets an Trainingsdaten leisten können. Dann könnte der angestrebte Schutz der Rechtsinhaber lediglich dazu führen, dass – wie in anderen Bereichen des Internets – einige wenige Firmen den gesamten KI-Markt kontrollieren. Es erscheint zweifelhaft, ob außer den großen Verlagshäusern, Bildagenturen und sonstigen Anbietern großer Datenmengen, auch die einzelnen, kleinen Künstler, Fotografen etc. wirklich von einer Lizenzierungspflicht profitieren würden. In der Masse der benötigten Trainingsdaten machen deren Werke nicht mehr aus als ein Sandkorn an einem Strand. Legt man dagegen die Fair-use-Schranke weit aus, so scheint es keinerlei Hindernisse mehr für die Entwicklung von generativer KI und die daran anknüpfende Flutung des Markts für menschengemachte Schöpfungen durch ein Vielfaches an computergenerierten Erzeugnissen zu geben.

Ausblick

Mit der Klage von Getty Images v. Stability AI steht die Welt des Urheberrechts an einem Scheideweg. Die Nutzung von urheberrechtlichen Werken für Zwecke des KI-Trainings ist ein technisches Novum. Niemand kann momentan vorhersehen, ob generative KI einen eher positiven oder einen eher negativen Einfluss auf die Kreativ-Branche haben wird. Die Bedenken von manchen Künstlern, wonach jeder Mensch mit einem Klick das gesamte Lebenswerk eines Künstlers imitieren kann, scheinen technisch machbar und deshalb berechtigt.[29] Auch werden viele Auftragsarbeiten wohl wesentlich günstiger und schneller durch KI erledigt werden können. Andererseits gab es schon ähnliche Bedenken von Malern während der Entwicklung der Fotografie, die sich als unberechtigt herausgestellt haben.[30] Begreift man generative KI — ähnlich wie den Fotoapparat – mehr als Werkzeug denn als Konkurrent, dann ergeben sich für menschliche Künstler ganz neue Möglichkeiten.

Mit den sog. Prompt Artists entsteht zum Beispiel gerade eine neue Berufsgruppe, deren Kunst darin besteht, generative KI mit wesentlich ausgefeilteren Eingaben als nur solchen wie “Photo-realistic giraffe underwater” zu bedienen. Schließlich ist zu berücksichtigen, dass es auch im analogen Bereich keinen urheberrechtlichen Stilschutz gibt. Solange ein Erzeugnis hinreichenden Abstand zu spezifischen bereits bestehenden Werken hält, sind künstlerische Konzepte oder “Looks” grds. nicht schutzfähig.[31] Das wird im zweiten Teil dieser Untersuchung näher beleuchtet werden. Für den ersten Teil ist abschließend festzuhalten, dass die amerikanische Rechtslage wesentlicher weniger vorhersehbar ist als die europäische. Mit ihren verhältnismäßig großzügigen Text und Data Mining Schranken bekennt sich die europäische Union klar zur urheberrechtlichen Zulässigkeit von KI-Training, was sie – um wiederum mit der amerikanischen Verfassungsklausel zum Urheberrecht zu sprechen – wohl als richtigen Weg auffasst “to promote the Progress of Science and useful Arts.”

 

Die Autoren:

Vincent M. Kästle ist Doktorand und wissenschaftlicher Mitarbeiter am Lehrstuhl von Prof. Dr. Felix Maultzsch, LL.M. an der Goethe Universität Frankfurt am Main.

Tobias Wolfenstätter ist wissenschaftlicher Mitarbeiter in der Kanzlei Arnecke Sibeth Dabelstein in Frankfurt am Main.

 

Responsible Editor:

Isabel Cagala, TLB Co-Editor-in-Chief

 

[1] Jüngst https://www.theverge.com/2023/9/20/23882009/class-action-lawsuit-openai-privacy-dropped; https://www.reuters.com/technology/more-writers-sue-openai-copyright-infringement-over-ai-training-2023-09-11/; https://www.techtarget.com/whatis/feature/AI-lawsuits-explained-Whos-getting-sued; https://www.bbc.com/news/technology-66866577 (Alle Links wurden zuletzt am 01.10.2023 abgerufen.)

[2] https://www.theverge.com/2023/2/6/23587393/ai-art-copyright-lawsuit-getty-images-stable-diffusion; https://www.harbottle.com/news/the-getty-images-v-stability-ai-dispute-a-potential-watershed-moment-for-ai-and-ip/; Die vollständige Klage findet sich bei: https://cdn.vox-cdn.com/uploads/chorus_asset/file/24412807/getty_images_vs_stability_AI_delaware.pdf

[3] https://stablediffusionweb.com/

[4] https://arstechnica.com/tech-policy/2023/04/stable-diffusion-copyright-lawsuits-could-be-a-legal-earthquake-for-ai/#:~:text=The%20plaintiffs%20in%20the%20class,copies%E2%80%9D%20of%20its%20training%20images

[5] Eine sehr ausführliche technische Erklärung findet sich bei https://jalammar.github.io/illustrated-stable-diffusion/

[6] https://laion.ai/blog/laion-5b/; https://laion.ai/blog/laion-stable-horde/; https://www.golem.de/news/laion-5b-datensatz-zum-ki-training-bietet-fast-6-milliarden-bilder-2212-170470.html

[7] https://techcrunch.com/2022/08/12/a-startup-wants-to-democratize-the-tech-behind-dall-e-2-consequences-be-damned/

[8] https://arstechnica.com/information-technology/2022/09/artist-finds-private-medical-record-photos-in-popular-ai-training-data-set/

[9] Siehe nur: Wandtke/Bullinger/Heerma, 6. Aufl. 2022, UrhG § 15 Rn. 10.

[10] BGH GRUR 2010, 628, 630

[11] BGH GRUR 2010, 628, 631

[12] Sega Enterprises Ltd. v. Accolade, Inc., 977 F.2d 1510 (9th Cir. 1992)

[13] Quang, Does Training AI Violate Copyright Law?, 36 Berkeley Technology Law Journal, 1407, 1416 (2022)

[14] Leval, Commentary, Toward a Fair Use Standard, 103 Harv. L. Rev. 1005, 1111 (1990)

[15] Perfect 10, Inc. v. Amazon.com, Inc., 508 F.3d 1146, 1167 (9th Cir., 2007)

[16] Authors Guild v. Google 721 F.3d 132 (2nd Cir. 2015); Pfeifer, Buchausschnitte als Thumbnails – Google Books und Fair Use, GRUR-Prax 2013, 529, 529 ff.

[17] Ausführlich hierzu Sag, Predicting Fair Use, 73:1 Ohio State Law Journal, 47-91 (2012)

[18] Maamar, ZUM 2023, 481, 482

[19] Von Welser, Generative KI und Urheberrechtsschranken, GRUR-Prax 2023, 516, 517 ff.

[20] Söbbing/Schwarz, Urheberrechtliche Grenzen für lernende künstliche Intelligenz. Der neue § 44b UrhG und seine Möglichkeiten und Grenzen beim Machine Learning sowie die Anwendung von § 60d UrhG, RDi 2023, 415, 416

[21] Pesch/Böhme, Artpocalypse now? – Generative KI und die Vervielfältigung von Trainingsbildern, GRUR 2023, 997

[22] https://news.bloomberglaw.com/ip-law/stability-ai-asks-court-to-toss-getty-lawsuit-or-transfer-it

[23] https://copyrightblog.kluweriplaw.com/2022/08/24/the-uk-government-moves-forward-with-a-text-and-data-mining-exception-for-all-purposes/

[24] https://hai.stanford.edu/news/reexamining-fair-use-age-ai

[25] https://investor.shutterstock.com/news-releases/news-release-details/shutterstock-expands-partnership-openai-signs-new-six-year

[26] https://www.adobe.com/sensei/generative-ai/firefly.html

[27] https://www.axios.com/2023/07/13/ap-openai-news-sharing-tech-deal

[28] Quang, Does Training AI Violate Copyright Law?, 36 Berkeley Technology Law Journal, 1407, 1414 ff. (2022)

[29] https://www.theverge.com/23444685/generative-ai-copyright-infringement-legal-fair-use-training-data

[30] Lee, The Past is Photog, 31.02 WIRED US Feb. 23, 44-46

[31] Vgl. nur BGH GRUR 1988, 690 – Kristallfiguren