Ny retssag hævder Mark Zuckerberg instruerede massivt AI Copyright Theft

At bruge indhold, der ikke tilhører dig, er en forbrydelse. Det er en form for tyveri, ikke anderledes end at stjæle en persons bil eller deres fjernsyn.

Indholdet har en ejer. Når en forfatter skriver en bog, tilfreds af bogen ejes af forfatteren. Det samme koncept gælder for OnlyFans-piger, der filmer film til deres side. Den person, der har skabt filmen, ejer rettighederne til den.

Når du stjæler det, bliver det en forbrydelse. Men hvad nu hvis den person, der stjæler dit indhold, er en virksomhed på flere milliarder dollar?

Fem store forlag og bestseller forfatter Scott Turow har anlagt et gruppesøgsmål mod Meta Platforms og CEO Mark Zuckerberg, hvor de anklager virksomheden for ulovligt at kopiere millioner af bøger, tidsskriftsartikler og andre skriftlige værker for at træne dets kunstige intelligenssystemer til Llama.

Retssagen, der er anlagt ved den amerikanske distriktsdomstol for det sydlige distrikt i New York, navngiver Elsevier, Cengage, Hachette, Macmillan, McGraw-Hill, Turow og SCRIBE Inc. som sagsøgere. Klagen hævder, at Meta engagerede sig i en af ​​de største ophavsretskrænkelser i historien ved at downloade ophavsretligt beskyttede værker fra piratlagre, kopiere dem gentagne gange under AI-træning og bruge dem til at drive kommercielle AI-systemer.

“I deres bestræbelser på at vinde AI ‘våbenkapløbet’ og opbygge en funktionel generativ AI-model, fulgte sagsøgte Meta og Zuckerberg deres velkendte motto: ‘bevæg dig hurtigt og bryd tingene’,” hedder det i klagen.

I centrum af sagen er påstanden om, at Mark Zuckerberg personligt godkendte brugen af ​​piratkopierede materialer, efter at Meta kort har undersøgt licensaftaler med udgivere. Ifølge klagen diskuterede Meta internt at øge sit “datasætlicenseringsbudget” til så meget som $200 millioner i begyndelsen af ​​2023, før de opgav denne strategi.

Sagsøgere hævder, at spørgsmålet blev eskaleret direkte til Mark Zuckerberg, hvorefter Meta-medarbejdere blev instrueret i at standse licensindsatsen og i stedet stole på piratkopierede datasæt såsom LibGen og Anna’s Archive.

Klagen hævder, at Meta-medarbejdere anerkendte interne juridiske og etiske bekymringer omkring brugen af ​​piratdepoter. Et internt notat beskrev LibGen som “et datasæt, vi ved er piratkopieret,” mens en anden medarbejder angiveligt advarede om, at torrenting af ophavsretsbeskyttet materiale fra virksomhedens infrastruktur “ikke føles rigtigt.”

Meta nægtede at have begået fejl. En talsmand sagde, at virksomheden mener, at AI-træning i ophavsretligt beskyttet materiale kan kvalificeres som rimelig brug, og sagde, at Meta ville “bekæmpe denne retssag aggressivt.”

Retssagen markerer en betydelig eskalering i den voksende juridiske konflikt mellem AI-udviklere og forlagsindustrien. Mens forfattere og medievirksomheder har sagsøgt AI-firmaer før, går denne sag ud over bredere fair use-argumenter ved at fokusere stærkt på påstande om bevidst piratkopiering, torrenting og fortielser.

Forlagene hævder, at problemet ikke kun er, at Meta “lærte” af bøger. De hævder, at virksomheden systematisk gik uden om eksisterende licensmarkeder og brugte ophavsretsligt beskyttede værker uden kompensation til at bygge et kommercielt produkt til flere milliarder dollar.

Den sondring er central for, hvorfor sagen har betydning.

Udgivere licenserer allerede bøger, tidsskrifter og undervisningsmateriale på tværs af en række digitale markeder, herunder e-bøger, abonnementsdatabaser, forskningsarkiver og læringsplatforme. Sagsøgerne hævder, at AI-træning er blevet endnu et legitimt licensmarked, et som Meta oprindeligt anerkendte, før det angiveligt besluttede, at det var billigere og strategisk sikrere at stole på piratkopier i stedet.

Hvis domstolene i sidste ende tillader AI-virksomheder at træne systemer på ophavsretligt beskyttede værker uden tilladelse eller betaling, hævder udgivere, at de økonomiske incitamenter, der understøtter forfatterskab, journalistik og videnskabelig udgivelse, hurtigt kan udhules.

Retssagen hævder også, at Llama kan generere output, der direkte konkurrerer med de originale værker, den blev trænet på. Ifølge klagen kan AI-systemet producere lærebogsresuméer, parafraser, imitationsromaner, studievejledninger, erstatningskapitler og uautoriserede efterfølgere, der erstatter menneskeskabte bøger.

Et eksempel inkluderet i klagen viser, at Lama angiveligt gengiver passager fra en lærebog i Cengage-regning næsten ordret efter minimal tilskyndelse. Et andet eksempel beskriver et system, der genererer detaljerede resuméer af videnskabelige artikler udgivet af Elsevier, mens det også introducerer opdigtede fakta og hallucinerede citater.

For uddannelsesforlag er indsatsen særlig høj, fordi deres forretningsmodeller i stigende grad afhænger ikke kun af lærebøger, men også af digitale læringsværktøjer, studiehjælpemidler og abonnementsbaserede uddannelsesplatforme. Sagsøgerne hævder at AI-genererede erstatninger truer disse indtægtsstrømme ved at tilbyde gratis alternativer baseret på ophavsretligt beskyttet materiale.

Videnskabelige udgivere advarer om en yderligere fare: misinformation. Klagen hævder, at Llama kan generere overbevisende, men unøjagtige udslag af peer-reviewede forskningsartikler, hvilket potentielt skader udgiveres og forfatteres omdømme, mens de spreder upålidelig information præsenteret som autoritativt stipendium.

Forfattere frygter i mellemtiden, at generativ kunstig intelligens kan underminere den økonomiske værdi af selve kreativ skrivning. Klagen omfatter eksempler på Llama, der angiveligt har produceret imiteret fiktion og uautoriserede efterfølgere modelleret efter eksisterende romaner, herunder værker af Turow og andre bestsellerforfattere.

Retssagen peger også på et bredere markedsproblem, der allerede dukker op online. Sagsøgere citerer den voksende strøm af AI-genererede bøger på digitale markedspladser som Amazon, hvor billigt AI-skrevet indhold i stigende grad konkurrerer med menneskeforfattede værker om synlighed og salg.

Baggrunden for sagen er det uløste juridiske spørgsmål, der dominerer AI-industrien: om træning af AI-systemer på ophavsretligt beskyttet materiale udgør “fair use” under amerikansk lov om ophavsret.

AI-virksomheder hævder, at træning er transformativt, fordi modeller analyserer statistiske mønstre i stedet for blot at genudgive værker. Domstolene har tidligere accepteret dele af dette argument. I juni 2025 afgjorde en føderal dommer til Metas favør i en separat retssag anlagt af forfattere, herunder Sarah Silverman og Junot Díaz, og fandt, at aspekter af Metas AI-træning kvalificerede som rimelig brug.

Denne nye retssag forsøger at udmærke sig ved at understrege påstande om forsætlig piratkopiering og forsætlig krænkelse. Klagen hævder gentagne gange, at Meta bevidst downloadede ophavsretligt beskyttede værker fra berygtede piratkopieringssider, skjulte sin brug af disse materialer og fjernede oplysninger om ophavsretsstyring fra filer for at gøre kilderne sværere at spore.

Sagsøgerne anmoder om uspecificeret økonomisk erstatning, et permanent forbud mod yderligere krænkelse, offentliggørelse af Metas træningsmateriale og -metoder og ødelæggelse af krænkende kopier under rettens tilsyn.

Resultatet kan få vidtrækkende konsekvenser for fremtiden for generativ AI og forlagsindustrien. En afgørelse i Metas favør kunne styrke argumentet om, at AI-udviklere frit kan træne på ophavsretligt beskyttet materiale i stor skala. En afgørelse til udgiverne kan tvinge AI-virksomheder til at forhandle dyre licensaftaler og fundamentalt omforme, hvordan træningsdata erhverves.

Udgivere og forfattere hævder, at værdien af ​​generative AI-systemer kommer direkte fra årtiers menneskeskabte bøger, forskning og journalistik. AI-udviklere hævder, at innovation afhænger af, at maskiner kan lære af den store mængde af eksisterende menneskelig viden.

Hvem der vinder denne kamp vil uden tvivl blive bestemt af en massiv samling af retssager, dette er blot en af ​​dem.