Free Software Foundation: Mit freien Inhalten trainierte KI-Modelle sollten für alle frei sein
Die Free Software Foundation (FSF) hat Anthropic erneut für die Nutzung ihrer Materialien beim Training der KI-Modelle kritisiert. Zugleich fordert die Organisation auch von anderen LLM-Entwicklern, Modelle, die mit frei zugänglichen Inhalten trainiert wurden, ebenfalls frei für Nutzer bereitzustellen.
Freie Werke fallen unter Fair Use
Die FSF und Anthropic blicken bereits auf eine bewegte Geschichte juristischer Auseinandersetzungen zurück. Zuletzt trafen beide Parteien sowie Meta im Juni 2025 im Rahmen einer von drei Autoren angestrebten Sammelklage aufeinander, in der es um die Nutzung von im Internet verfügbaren Werken zum Training von Anthropics KI-Modellen ging. Beide Seiten konnten in dem Rechtsstreit seinerzeit Erfolge für sich verbuchen: So befand das Gericht damals, dass das Verwenden von im Netz verfügbaren Büchern unter die Fair-Use-Regelung falle, da bei der Verwendung geschützter Werke für das Training eines Large Language Models (LLM) etwas Neues entstehe. Das Vorgehen sei somit transformativ, was eine Grundvoraussetzung für die Annahme von Fair Use darstellt.
Eine Rechtsverletzung hatte seinerzeit laut dem Gerichtsurteil dennoch stattgefunden, da sich Anthropic und Meta urheberrechtlich geschützte Werke aus illegalen Quellen beschafft und behalten hatten – Copyright-Piraterie wie bei dem verwendeten Books3- und LibGen-Datensatz, welche Millionen von Büchern enthalten haben, sei laut dem damals verantwortlichen Richter William Alsup durch Fair Use nicht abgedeckt. Im Rahmen eines Vergleiches erklärte sich Anthropic im September 2025 zur Einrichtung eines 1,5 Milliarden Euro hohen Fonds bereit, um Autoren zu entschädigen, deren Werke das Unternehmen ohne Genehmigung zum Trainieren seiner Modelle verwendet hatte.
Unternehmen sollen Daten teilen
Unter den Büchern, die für das Training genutzt wurden, befanden sich allerdings auch zahlreiche freie Werke, wie beispielsweise „Free as in Freedom: Richard Stallman's Crusade for Free Software“ von Sam Williams. Dieses wurde laut der FSF von O'Reilly und der FSF unter der GNU Free Documentation License (GNU FDL) veröffentlicht.
Die freie Lizenz erlaube laut der FSF die Nutzung des Werks für jeden Zweck ohne Bezahlung. Aus diesem Grund fordert die Organisation Anthropic auf, die vollständigen Trainingsdaten mit jedem Nutzer des LLM kostenlos zu teilen, zusammen mit dem vollständigen Modell, den Einstellungen der Trainingskonfigurationen und dem dazugehörigen Software-Quellcode. Allerdings dürfte der FSF klar sein, dass der KI-Spezialist dieser Forderung nicht nachkommen wird – nicht zuletzt auch, weil die Organisation ebenso erklärte, dass ihr die Ressourcen für einen langjährigen Rechtsstreit fehlen würden. Sie erklärte allerdings ebenso, dass sie, sollte sie sich an einem Rechtsstreit beteiligen und dabei feststellen, dass ihre Urheberrechte und Lizenzen verletzt wurden, „als Entschädigung sicherlich die Freiheit der Nutzer fordern würde“.
Erkenntnisse aus freien Werken soll kostenlos sein
Vor diesem Hintergrund darf eher davon ausgegangen werden, dass die FSF hier eine öffentliche Debatte darüber entfachen will, dass bei der Nutzung freier Inhalte auch deren Bedingungen in Bezug auf den freien Gedanken weitergetragen werden sollten – und dass Konzerne mit zum Allgemeinwohl freigegebenen Inhalten Einnahmen generieren, während andere, die auf die Erkenntnisse aus diesen Werken zugreifen wollen, dafür bezahlen müssen.