CENTRUM.CZ > Techzpravy.cz > dnes, 03:45

Meta, Microsoft i OpenAI čelí žalobám kvůli autorským právům

Sdílet

Zdroj: cienpies / Depositphotos

Byla by umělá inteligence tam, kde je nyní, kdyby Silicon Valley muselo platit za každou knihu, kterou jeho modely umělé inteligence přečtou?

Byla by umělá inteligence tam, kde je nyní, kdyby Silicon Valley muselo platit za každou knihu, kterou jeho modely umělé inteligence přečtou?

Modely umělé inteligence schopné generovat text se v našem každodenním životě objevují stále častěji. A to nutí mnoho lidí klást si zásadní otázku: kde se tyto stroje naučily psát tak, jak píší? Odpověď zní, že tak učinily tím, že během svého tréninku „přečetly“ miliony knih, v mnoha případech bez autorizace jejich autorů.

Schopnost těchto modelů vytvářet souvislý a kontextualizovaný text vychází z jejich vystavení obrovským objemům textových dat. Tato data zahrnují nejen knihy, ale také zpravodajské články, příspěvky na sociálních sítích a další. Knihy jsou však bohatým zdrojem strukturovaného jazyka a hlubokého obsahu, což je pro trénink AI obzvláště cenné.

A nejen to: v případech, jako je tomu v případě umělé inteligence LLaMa společnosti Meta, probíhalo její školení poté, co se společnost bez okolků uchýlila k masivnímu stahování knih z online knihoven, které nebyly autorizovány držiteli práv, jako je například LibGen.

Mohlo by vás zajímat: Microsoft se snaží přesvědčit firmy k používání Copilota. Moc se mu to ale nedaří

Z nedávných soudních důkazů vyplývá, že Zuckerbergova společnost údajně trvala na tom, že se k těmto zdrojům uchýlí i poté, co o tom inženýři interně vyjádřili pochybnosti:

„Nezdá se mi správné stahovat torrenty z firemního počítače“.

A nyní jak používání knih, tak jejich diskutovaný původ rozpoutaly zajímavou právní debatu a v poslední době vedly k několika soudním sporům, které ještě nebyly soudně vyřešeny.

Případ Anthropic: Čtení, nebo krádež?

Nedávné rozhodnutí federálního soudce Williama Alsupa v případu proti společnosti Anthropic, která stojí za modelem jazyka Claude, bylo označeno za historické: ve svém rozhodnutí před dvěma dny Alsup určil, že trénování umělé inteligence pomocí knih chráněných autorskými právy může podle amerického práva představovat „spravedlivé použití“.

Soudce šel ve skutečnosti ještě dál a přirovnal učení LLM (rozsáhlých jazykových modelů) k procesu, kdy lidský čtenář studuje autory, aby si vytvořil vlastní styl. Podle jeho slov bylo použití knih umělou inteligencí „velkolepě transformativní“, protože nešlo o kopírování, ale o vytvoření něčeho jiného.

A landmark ruling by the US District Court this week declared training LLMs on copyrighted books is FAIR USE! The court affirmed that just as humans learn from books to write better, so can AI.

A monumental win for innovation! pic.twitter.com/mZJngwjFdP

— Jeff McLeod (@Jeffmcleod) June 26, 2025

To však neznamená, že Alsup dal tomuto odvětví carte blanche: ve stejném rozsudku odsoudil společnost Anthropic za to, že shromáždila více než 7 milionů knih stažených z neautorizovaných zdrojů a vytvořila centrální digitální knihovnu, což označil za přímé porušení autorských práv. Přestože společnost později mnoho z těchto knih odkoupila, nezbavuje ji to odpovědnosti: v prosinci se bude konat soud, který určí ekonomickou škodu.

Microsoft v centru pozornosti

Rozhodnutí antropologického soudu kontrastuje se situací, v níž se nyní nachází společnost Microsoft, kterou žaluje skupina známých amerických spisovatelů, kteří tvrdí, že společnost použila neoficiálně naskenované verze téměř 200 000 knih k tréninku svého modelu „Megatron“ bez souhlasu nebo náhrady od držitelů práv.

Žaloba tvrdí, že tento postup nejen porušuje autorská práva, ale také umožňuje umělé inteligenci generovat text, který napodobuje styl, syntax a témata původních autorů. Společnost Microsoft, která se zatím nevyjádřila, se připojuje k rostoucímu seznamu technologických společností, jako jsou OpenAI, Meta a samotný Anthropic, které čelí soudním sporům kvůli neoprávněnému používání obsahu chráněného autorskými právy.

Nezapomínejme na OpenAI

Pokud se Microsoft a Anthropic dostaly pod soudní a mediální kontrolu kvůli používání autorsky chráněných děl při trénování svých modelů, OpenAI – společnost, která zpopularizovala generativní umělou inteligenci pomocí ChatGPT – není daleko za nimi. Ačkoli se snaží vytvářet image spolupráce a transparentnosti, z toho, co zatím víme, vyplývá, že se také dopouští podobných praktik jako její konkurenti. Ve skutečnosti prý své konkurenty předběhla.

Nedávno totiž společnost OpenAI potvrdila, že odstranila dvě klíčové datové sady – „books1“ a „books2“ – které byly použity k trénování raných verzí jejího modelu GPT-3: podle soudních dokumentů odtajněných v rámci žaloby podané americkou organizací Authors Guild tyto datové sady pravděpodobně obsahovaly více než 100 000 publikovaných knih, z nichž mnohé mají platná autorská práva.

Tyto dvě datové sady představovaly 16 % tréninkových dat modelu GPT-3, což odpovídá přibližně 50 miliardám slov.

Společnost OpenAI tvrdí, že tato data byla v roce 2022 odstraněna z důvodu „nedostatečného využití“ a že její současné modely – například GPT-4 nebo modely nabízené prostřednictvím rozhraní API – nebyly na těchto sadách vyškoleny.

Vše nasvědčuje tomu, že společnost OpenAI, stejně jako později jiné technologické společnosti, měla za to, že získávání individuálních licencí pro každé dílo je logistickou a ekonomickou překážkou neslučitelnou s rychlostí vývoje jejích modelů. Řešením by bylo jednoduše trénovat s čímkoli, co bylo k dispozici, bez ohledu na právní status textů.

Co je to „spravedlivé použití“ a proč na něm záleží?

Doktrína „spravedlivého užití“ umožňuje omezené užití chráněných děl bez souhlasu držitele práv v určitých kontextech, jako je kritika, výuka nebo tvůrčí transformace. V případě Anthropic se soudce Alsup domnívá, že AI nereprodukuje rozpoznatelné fragmenty ani nenahrazuje původní díla na trhu. Místo toho je transformuje a vytváří nové texty, což je v souladu s duchem zákona: podporovat kreativitu a vědecký pokrok.

Video k článku ZDE

Přesto není řečeno vše. Rozhodnutí ve věci Alsup je sice průlomové, ale není závazné pro ostatní soudy. Ve skutečnosti se očekává, že se tato záležitost dostane až k Nejvyššímu soudu USA, a to vzhledem k množství podobných soudních sporů, které jsou v běhu.

Když se umělá inteligence přestane učit a začne kopírovat

Nejčastěji se opakující obrana technologických gigantů proti obviněním z plagiátorství byla přímočará: jazykové modely nekopírují, ale „učí se vzory“. Výzkumníci z několika amerických univerzit však nedávno prokázali, že LLaMa 3.1 společnosti Meta si doslova zapamatoval až 42 % knihy Harry Potter a kámen mudrců.

Tato schopnost zapamatování není triviální ani náhodná: model porovnával dlouhé sekvence textu s průměrnou přesností 98,5 %, což znamená nejen seznámení se s původním obsahem, ale i jeho téměř textovou reprodukci. Je pravda, že LLaMa 3.1 si nepamatuje všechny knihy stejně. Má tendenci zapamatovat si mnohem více ty tituly, které jsou populární a široce dostupné na pirátských stránkách, jako je LibGen. A tak zatímco si zapamatoval téměř polovinu Harryho Pottera, z méně známého románu, jako je Sandman Slim, jehož autorem je Richard Kadrey, jeden z účastníků hromadné žaloby proti Metě, si zapamatoval pouze 0,13 %.

Do jaké míry model obsahuje dílo

Studie přímo zpochybňuje zákonnost samotného modelu. Pokud váhy LLaMa 3.1 obsahují explicitní zobrazení chráněných fragmentů, jak naznačuje i americký úřad pro autorská práva, mohl by být model považován za kopii porušující autorská práva, i když tyto věty nikdy spontánně nevytváří.

A to zasahuje samotné jádro argumentu „spravedlivého užití“: protože by se již nejednalo o model, který se „naučil psát“, ale o něco velmi podobného databázi převlečené pod rouškou umělé inteligence.

Závěrem lze říci, že debata o používání knih chráněných autorským právem k trénování modelů umělé inteligence je složitý problém, který zdaleka není vyřešen. Technologie se rychle vyvíjejí, ale zákony o autorských právech se ne vždy přizpůsobují stejně rychle. To představuje pro technologický průmysl, tvůrce obsahu a zákonodárce značné výzvy.

DALŠÍ ČLÁNKY z Techzpravy.cz

Vybrali jsme pro vás MAGAZÍNY A ZAJÍMAVOSTI

Karvinské moře má novou dominantu, stráží ho přes tři metry vysoká socha Neptuna

Ostravská Drbna - zprávy z Ostravy a Moravskoslezského kraje|

dnes, 17:30

Karvinské moře má novou dominantu, stráží ho přes tři metry vysoká socha Neptuna

Oblíbená rekreační lokalita Karvinské moře má novou dominantu. Symbolicky ho stráží římský bůh Neptun....

Pokora žádná a jen se zesměšňuje. Mourinho by to měl zabalit! má jasno slavná legenda

SportWin » bavme se sportem|

dnes, 17:22

Pokora žádná a jen se zesměšňuje. Mourinho by to měl zabalit! má jasno slavná legenda

Bývalý obránce Chelsea Marcel Desailly nezahaluje kritiku do diplomatických obalů. Podle něj by José...

Má víc medailí než celé Česko. Přesto Střela z Baltimoru pomýšlela i na sebevraždu

Sport - Aktuálně.cz|

dnes, 17:17

Má víc medailí než celé Česko. Přesto Střela z Baltimoru pomýšlela i na sebevraždu

Rekordman v počtu získaných olympijských medailí a jeden z největších sportovců historie Michael Phelps...

Tropická vedra zvyšují riziko otravy z jídla. Pozor na grilování, vejce i zmrzlinu

Žena.cz|

dnes, 17:15

Tropická vedra zvyšují riziko otravy z jídla. Pozor na grilování, vejce i zmrzlinu

Vysoké teploty vytvářejí ideální prostředí pro rychlé množení mikroorganismů v potravinách a roste tak...

Správci KRNAP se začátkem letních prázdnin vyzývají k dodržování pravidel

Hradecká Drbna|

dnes, 17:10

Správci KRNAP se začátkem letních prázdnin vyzývají k dodržování pravidel

Správci Krkonošského národního parku (KRNAP) se začátkem letní sezony nabádají návštěvníky Krkonoš, aby...

Včera prašivé, dnes jsou hvězdami. Zbrojovkám ale mohou vysoké zisky zase rychle spadnout

HN.cz|

dnes, 17:07

Včera prašivé, dnes jsou hvězdami. Zbrojovkám ale mohou vysoké zisky zase rychle spadnout

Finanční správa nedávno zveřejnila seznam největších plátců daně ze zisku za rok 2024. Převážně jde o...

PŘEHLED: Kam za historií v Olomouckém kraji? Hrady a zámky, které letos stojí za návštěvu

Hanácká Drbna|

dnes, 17:04

PŘEHLED: Kam za historií v Olomouckém kraji? Hrady a zámky, které letos stojí za návštěvu

Prázdniny začaly, a proto přinášíme několik tipů na hrady a zámky v Olomouckém kraji, které okouzlí nejen...

České celebrity, kterým ve vztahu nevadí obrovský věkový rozdíl: Např. Bohuš Matuš čelil kritice

In-lifestyle.cz|

dnes, 17:03

České celebrity, kterým ve vztahu nevadí obrovský věkový rozdíl: Např. Bohuš Matuš čelil kritice

Věk je jenom číslo, ale když se zeptáme na ideální věkový rozdíl v manželství, málokdo odpoví pětadvacet,...

Deštníkáři opět změnili taktiku, Praha proto upraví tržní řád

Pražská Drbna - zprávy z Prahy|

dnes, 17:00

Deštníkáři opět změnili taktiku, Praha proto upraví tržní řád

Takzvaní deštníkáři, kteří turistům v Praze nabízejí zážitkové jízdy autobusy, našli skulinu ve vyhlášce....

Most Otakara Ševčíka v Brně je po více než dvou letech znovu plně průjezdný

Brněnská Drbna|

dnes, 17:00

Most Otakara Ševčíka v Brně je po více než dvou letech znovu plně průjezdný

Stavbaři dokončili veškeré práce na mostě v ulici Otakara Ševčíka v Brně. Po dvou a půl letech je tak most...

Doporučujeme

Právě se děje

"Raději ten balon sežer." Španělkám vzala titul obrovská chyba, hráčka se zhroutila

Meta, Microsoft i OpenAI čelí žalobám kvůli autorským právům

"Raději ten balon sežer." Španělkám vzala titul obrovská chyba, hráčka se zhroutila

Šetřivá Diana Kobzanová našla cestu, jak ušetřit na prázdninách v Americe

Má víc medailí než celé Česko. Přesto Střela z Baltimoru pomýšlela i na sebevraždu

Zrno z Ukrajiny: Drsné kontroly na hranici, vezeme pomoc pro vojáky

Češi dělají na dovolené věci, které byste nečekali. Slováci se baví na náš účet