NVIDIA soll den Zugriff auf raubkopierte Bücher für KI-Training genehmigt haben. Die Vorwürfe stammen aus einer erweiterten Sammelklage mehrerer US-Autoren.

• NVIDIA soll aktiv Kontakt zu Schattenbibliothek aufgenommen haben

• Interne Dokumente stammen aus erweiterten Sammelklage von US-Autoren

• NVIDIA-Mitarbeiter erkundigte sich wohl nach 500 Terabyte Buchdaten



Sammelklage mit brisanten Vorwürfen

Der Chipkonzern NVIDIA sieht sich mit schwerwiegenden Anschuldigungen konfrontiert. Wie aus einer am 17. Januar 2026 beim US-Bundesbezirksgericht für den nördlichen Bezirk von Kalifornien eingereichten erweiterten Klageschrift hervorgeht, soll das Unternehmen aktiv Kontakt zur sogenannten Schattenbibliothek "Anna's Archive" aufgenommen haben. Ziel sei es gewesen, Zugang zu riesigen Mengen urheberrechtlich geschützter Bücher für das Training eigener KI-Modelle zu erhalten.

Wie das auf Urheberrechtsfragen spezialisierte Magazin TorrentFreak berichtet, sollen interne E-Mails und Dokumente zeigen, dass ein Mitglied von NVIDIAs Datenstrategie-Team die Betreiber der Piraterie-Bibliothek kontaktierte. Der Mitarbeiter habe sich nach den Möglichkeiten eines schnellen Zugriffs auf rund 500 Terabyte Daten erkundigt, um diese in die Trainingsdaten für NVIDIAs eigene Large Language Models einzubinden.

Warnung ignoriert - Genehmigung erteilt

Besonders brisant: Anna's Archive soll NVIDIA ausdrücklich darauf hingewiesen haben, dass die angebotenen Inhalte illegal beschafft wurden und habe nachgefragt, ob eine interne Genehmigung für den Zugriff vorliege. Laut Klageschrift wurde diese Freigabe innerhalb einer Woche durch das NVIDIA-Management erteilt.

Anna's Archive bot dem Konzern daraufhin Zugang zu etwa 500 Terabyte an Daten an, darunter Millionen Bücher, die normalerweise nur über eingeschränkte digitale Leihsysteme wie das Internet Archive zugänglich sind. Die Schattenbibliothek soll mehr als 10.000 US-Dollar für den sogenannten Express-Zugang verlangt haben. Ob NVIDIA tatsächlich gezahlt hat, geht aus den Dokumenten nicht hervor.

Weitere Vorwürfe und Hintergrund der Klage

Die ursprüngliche Klage wurde laut "heise online" bereits Anfang 2024 von mehreren US-Autoren eingereicht, darunter Abdi Nazemian, Brian Keene und Stewart O'Nan. Sie warfen NVIDIA vor, ihre urheberrechtlich geschützten Werke aus dem Books3-Datensatz ohne Erlaubnis für das Training von KI-Modellen wie NeMo, Megatron und Retro-48B genutzt zu haben. NVIDIA verteidigte sich damals mit dem Argument der "Fair Use"-Regelung - Texte würden für KI-Systeme lediglich als statistische Muster dienen.

Die nun erweiterte Klageschrift geht jedoch deutlich weiter. Zusätzlich zu Anna's Archive soll NVIDIA auch Inhalte von LibGen, Sci-Hub und Z-Library heruntergeladen und verwendet haben. Darüber hinaus wirft die Klage dem Unternehmen vor, Skripte und Werkzeuge an Geschäftskunden verteilt zu haben, mit denen diese einen Datensatz namens "The Pile" automatisch herunterladen konnten - ein Datensatz, der neben gemeinfreien Werken auch den raubkopierten Books3-Datensatz enthält. Die Kläger sehen darin einen Fall von mittelbarer Urheberrechtsverletzung, da NVIDIA indirekt von der Verbreitung profitiert haben soll.

Wie TorrentFreak hervorhebt, handelt es sich um das erste Mal, dass E-Mail-Korrespondenz zwischen einem großen US-Technologiekonzern und Anna's Archive öffentlich wurde. Der Fall reiht sich in eine wachsende Zahl von Klagen gegen Tech-Unternehmen wegen der Nutzung urheberrechtlich geschützter Inhalte für KI-Training ein - so laufen ähnliche Verfahren unter anderem gegen OpenAI und Meta.

