Ustanovení o vytěžování textů a dat
V roce 2019 směrnice o autorském právu na jednotném digitálním trhu umožnila komukoli pořizovat kopie a extrahovat velké množství údajů chráněných autorským právem, k nimž má zákonný přístup bez povolení držitele práv, za účelem provádění činností vytěžování dat. To je možné, pokud se nositel práv výslovně nerozhodne „neúčastnit se“ těžby údajů chráněných autorským právem (prostřednictvím strojově čitelných prostředků). Tato možnost neúčasti se nevztahuje na vytěžování dat kulturním dědictvím a výzkumnými institucemi pro výzkumné účely. V té době nebylo vytěžování textů a dat v jiných částech světa novinkou a Evropská unie byla konkurenčně znevýhodněna tím, že ve své jurisdikci neměla právní jasnost.
Tato ustanovení mají zajistit, aby autorské právo nebránilo příležitostem, které analýza velkého množství údajů přináší odvětvím výzkumu a kulturního dědictví v Evropské unii (podstatným zlepšením analýzy a dohledatelnosti informací) a informační společnosti jako celku.
Blokování vytěžování dat z údajů o kulturním dědictví
V roce 2019 se instituce kulturního dědictví, které prosazovaly demokratický přístup k informacím, vyslovily pro výjimky z vytěžování textů a dat. Bylo proto neočekávané, že by tytéž instituce zvážily využití možnosti neúčasti k zablokování těžby údajů o kulturním dědictví chráněném autorským právem.
Upuštění od tohoto typu zpracování vyvolalo nedávné diskuse v odvětví kulturního dědictví. Nizozemská národní knihovna například doplnila do svých podmínek znění, které zakazuje všem komerčním generativním UI těžit díla knihovny chráněná autorským právem. Prostřednictvím strojově čitelných metod výslovně zakazuje ChatGPT sklízet jejich sbírky.
V některých případech se zdá, že důvodem pro uplatnění výjimky je to, že nositelé autorských práv požadují tuto výjimku jako podmínku pro sdílení údajů prostřednictvím internetových stránek organizace kulturního dědictví. Někdy tak činí jednotliví nositelé práv nebo organizace kolektivní správy, jako je Pictoright v Nizozemsku a Sacem ve Francii. Někdy se však zdá, že ochota pochází od samotné instituce kulturního dědictví, která chce zajistit, aby tvůrci byli respektováni prostřednictvím transparentního (přisuzovaného) a na povolení založeného použití jejich výtvorů.
Některé z hlavních argumentů varují před potřebou zablokovat vytěžování dat, aby se zabránilo určitým „velkým technologickým“ společnostem pracujícím s generativní umělou inteligencí v vytěžování dat. Některé velké ziskové společnosti totiž analyzují velké množství údajů chráněných autorským právem bez větší transparentnosti. Byly kritizovány za to, že se živily „běžným“ obsahem (obsahem dostupným bez omezení autorských práv), aniž by k nim přispívaly a zároveň posilovaly jejich konkurenční výhodu.
Kromě toho, co je právně možné: Co by mělo odvětví kulturního dědictví představovat?
Instituce kulturního dědictví ve většině případů umožní přístup k materiálům, které buď nejsou chráněny autorským právem, nebo jsou chráněny a pro které nositelé práv schválili zveřejnění on-line, ale pro které instituce kulturního dědictví autorské právo nevlastní. V takových případech nejsou instituce kulturního dědictví oprávněny rozhodnout o uplatnění výjimky pro vytěžování dat. Mohou tak učinit pouze v případě, že existují autorská práva, a jsou držiteli autorských práv.
Ale i když ano, stojí za to se ptát, zda opt-out podporuje jejich cíle. Blokování možnosti využívat údaje o kulturním dědictví se svým způsobem zdá být v rozporu s posláním institucí kulturního dědictví financovaných z veřejných prostředků. Není poskytování důvěryhodných kvalitativních informací a boj proti dezinformacím a předpojatosti (v algoritmech) více v souladu s jejich cíli?
Pokud jde o nápravu špatné praxe některých velkých hráčů ve světě umělé inteligence, oslabilo by je vynechání údajů o kulturním dědictví? Velké technologické společnosti mohou převzít právní rizika, zaplatit pokutu nebo zaplatit cenu za legální vytěžování dat. Vyloučení údajů o kulturním dědictví jim nezabrání v jejich využívání, ale pravděpodobně bude mít negativní dopad na malé a střední podniky, novináře, odborníky v oblasti kulturního dědictví a samotné výzkumné pracovníky, kteří tyto údaje používají, a také na nástroje jak pro výzkum, tak i pro obecnější účely. Hrozí, že oslabí ty, kteří potřebují společné statky nejvíce. Hranice mezi obchodem a výzkumem jsou stále vágnější. Kde nakreslíme čáru?
Měly by instituce kulturního dědictví zajistit rovné podmínky a otevřený přístup ke kulturnímu obsahu pro všechny, a to i pro stroje? Pokud nejsou k dispozici nebo použita žádná řešení opt-out, která by byla vhodná pro použití v jednotlivých položkách, existuje jasné riziko, že použití strojově čitelného opt-out přeteče na veřejně přístupný materiál, který je k dispozici online.
Případ komerčně nedostupných děl
S výše uvedenou směrnicí o autorském právu byl přijat systém komerčně nedostupných děl: nové právní řešení, jehož prostřednictvím mohou instituce kulturního dědictví sdílet on-line ve svých sbírkách materiály, které nejsou (nebo již nejsou) v komerčním oběhu, i když se na ně vztahuje ochrana autorského práva, bez svolení nositele autorských práv. Tento nový systém odstraňuje (nemožnou) zátěž spojenou s odstraňováním autorských práv ve velkých sbírkách.
To obvykle vyžaduje získání licence od organizace kolektivní správy, která je reprezentativní pro dané druhy materiálů. Prostřednictvím směrnice jsou organizace oprávněny vydávat „rozšířené“ kolektivní licence: mohou institucím kulturního dědictví povolit použití materiálů, které jsou součástí repertoáru organizace kolektivní správy, ale také materiálů, které součástí repertoáru nejsou.
Některé organizace kolektivní správy zahrnují povinnost „neúčastnit se“ těžby těchto komerčně nedostupných děl, pokud je instituce kulturního dědictví sdílí on-line. V souvislosti s „rozšířenými“ kolektivními licencemi je to prakticky i právně problematické. Prakticky proto, že omezuje možnosti opětovného použití materiálu a představuje další zátěž pro instituci kulturního dědictví. Z právního hlediska, protože je sporné, zda je organizace kolektivní správy s „rozšířenou“ licencí kolektivní správy nositelem práv oprávněným uplatnit výjimku týkající se vytěžování dat.
Další kroky
My v komunitě autorského práva budeme vývoj v této oblasti i nadále pozorně sledovat. Zůstaňte naladěni a připojte se k naší komunitě prostřednictvím sdružení Europeana Network Association a sledujte nás na sociálních médiích. Chcete-li se s námi podělit o jakoukoli zpětnou vazbu k tomuto tématu, obraťte se prosím na [email protected].
Více informací o vytěžování textů a dat si můžete přečíst na stránkách copyrightuser.org a na portálu Communia CDSM Directive transposition portal.
