Ustanovenia o vyťažovaní textov a dát
V roku 2019 smernica o autorskom práve na digitálnom jednotnom trhu umožnila komukoľvek vyhotovovať kópie a extrahovať veľké množstvá údajov chránených autorským právom, ku ktorým má zákonný prístup bez povolenia držiteľa práv, s cieľom vykonávať činnosti hĺbkovej analýzy údajov. To je možné, pokiaľ sa nositeľ práv výslovne nerozhodne „odhlásiť“ údaje chránené autorským právom (prostredníctvom strojovo čitateľných prostriedkov) z ťažby. Táto možnosť neuplatňovania sa nevzťahuje na hĺbkovú analýzu údajov vykonávanú kultúrnym dedičstvom a výskumnými inštitúciami na výskumné účely. V tom čase vyťažovanie textov a dát nebolo v iných častiach sveta nové a Európska únia trpela konkurenčnou nevýhodou tým, že nemala právnu jasnosť vo svojej jurisdikcii.
Cieľom týchto ustanovení je zabezpečiť, aby autorské práva nebránili možnostiam, ktoré analýza veľkého množstva údajov prináša odvetviam výskumu a kultúrneho dedičstva v Európskej únii (podstatným zlepšením analýzy a vyhľadateľnosti informácií) a informačnej spoločnosti ako celku.
Blokovanie hĺbkovej analýzy údajov o kultúrnom dedičstve
V roku 2019 boli inštitúcie správy kultúrneho dedičstva, ktoré sa zasadzovali za demokratický prístup k informáciám, za výnimky týkajúce sa vyťažovania textov a dát. Preto bolo neočakávané, že tie isté inštitúcie zvážia využitie možnosti neúčasti na zablokovaní ťažby údajov o kultúrnom dedičstve chránenom autorským právom.
Odmietnutie tohto typu spracovania vyvolalo nedávne diskusie v odvetví kultúrneho dedičstva. Holandská národná knižnica napríklad doplnila do svojich obchodných podmienok znenie, ktoré zakazuje všetkým komerčným generatívnym AI ťažiť diela knižnice chránené autorským právom. Prostredníctvom strojovo čitateľných metód výslovne zakazuje ChatGPT zbierať ich zbierky.
V určitých prípadoch sa zdá, že dôvodom na zavedenie výnimky je to, že držitelia autorských práv žiadajú o túto výnimku ako podmienku zdieľania údajov prostredníctvom webového sídla organizácie správy kultúrneho dedičstva. Niekedy to robí jednotlivý držiteľ práv alebo organizácia kolektívnej správy, ako je Pictoright v Holandsku a Sacem vo Francúzsku. Niekedy sa však zdá, že ochota prichádza od samotnej inštitúcie správy kultúrneho dedičstva, ktorá chce zabezpečiť, aby tvorcovia boli rešpektovaní prostredníctvom transparentného (prideleného) používania ich výtvorov založeného na povoleniach.
Spomedzi hlavných argumentov niektorí upozorňujú na potrebu zablokovať hĺbkovú analýzu údajov s cieľom zabrániť tomu, aby určité „veľké technologické“ spoločnosti, ktoré pracujú s generatívnou umelou inteligenciou, získavali hĺbkovú analýzu údajov. Niektoré veľké ziskové spoločnosti skutočne analyzujú veľké množstvo údajov chránených autorským právom bez väčšej transparentnosti. Boli kritizovaní za to, že sa starali o „spoločnosť“ (obsah dostupný bez obmedzení autorských práv) bez toho, aby k nim prispievali a zároveň posilňovali svoju konkurenčnú výhodu.
nad rámec toho, čo je právne možné: Čo by malo predstavovať odvetvie kultúrneho dedičstva?
Vo väčšine prípadov inštitúcie správy kultúrneho dedičstva poskytnú prístup k materiálom, ktoré buď nie sú chránené autorským právom, alebo sú chránené a pre ktoré nositelia práv povolili vysielanie online, ale pre ktoré inštitúcia správy kultúrneho dedičstva nie je držiteľom autorských práv. V takýchto prípadoch inštitúcie správy kultúrneho dedičstva nie sú oprávnené rozhodnúť o uplatnení výnimky týkajúcej sa hĺbkovej analýzy údajov. Môžu tak urobiť len vtedy, ak existujú autorské práva a sú držiteľmi autorských práv.
Ale aj keď to urobia, stojí za to premýšľať, či odmietnutie podporuje ich ciele. Zablokovanie možnosti využívať údaje o kultúrnom dedičstve sa určitým spôsobom zdá byť v rozpore s poslaním verejne financovaných inštitúcií správy kultúrneho dedičstva. Nie je prínos dôveryhodných kvalitatívnych informácií a boj proti dezinformáciám a zaujatosti (v algoritmoch) viac v súlade s ich cieľmi?
Pokiaľ ide o nápravu zlej praxe niektorých veľkých aktérov vo svete umelej inteligencie, oslabili by ich údaje o kultúrnom dedičstve, ak by sa odhlásili? Veľké technologické spoločnosti môžu podstúpiť právne riziká, zaplatiť pokutu alebo zaplatiť cenu za zákonnú ťažbu údajov. Vylúčenie údajov o kultúrnom dedičstve im nezabráni v ich používaní, ale pravdepodobne bude mať negatívny vplyv na MSP, novinárov, odborníkov v oblasti kultúrneho dedičstva a samotných výskumných pracovníkov, ktorí tieto údaje používajú, ako aj na nástroje na výskumné, ale aj všeobecnejšie účely. Hrozí, že oslabí tých, ktorí najviac potrebujú spoločné. Hranice medzi obchodom a výskumom sú čoraz nejasnejšie. Kde nakreslíme čiaru?
Mali by inštitúcie správy kultúrneho dedičstva zabezpečiť rovnaké podmienky a otvorený prístup ku kultúrnemu obsahu pre všetkých, a to aj prostredníctvom strojov? Ak nie sú k dispozícii alebo sa nepoužívajú žiadne riešenia opt-out, ktoré by boli vhodné na použitie po jednotlivých položkách, existuje jasné riziko, že uplatňovanie strojovo čitateľného opt-out pretečie na verejne prístupný materiál, ktorý je sprístupnený online.
Prípad obchodne nedostupných diel
S uvedenou smernicou o autorských právach bol prijatý systém obchodne nedostupných diel: nové právne riešenie, prostredníctvom ktorého môžu inštitúcie správy kultúrneho dedičstva zdieľať materiály online vo svojich zbierkach, ktoré nie sú (alebo už nie sú) v komerčnom obehu, aj keď podliehajú ochrane autorských práv, bez povolenia držiteľa autorských práv. Tento nový systém odstraňuje (nemožné) bremeno vysporiadania autorských práv vo veľkých zbierkach.
Vo všeobecnosti si to vyžaduje získanie licencie od organizácie kolektívnej správy, ktorá je reprezentatívna pre príslušné druhy materiálov. Prostredníctvom smernice sú organizácie oprávnené udeľovať „rozšírené“ kolektívne licencie: môžu oprávniť inštitúcie správy kultúrneho dedičstva, aby používali materiály, ktoré sú súčasťou repertoáru organizácie kolektívnej správy, ale aj materiály, ktoré nie sú súčasťou repertoáru.
Niektoré organizácie kolektívnej správy zahŕňajú povinnosť „vyňať“ tieto obchodne nedostupné diela z ťažby, ak ich inštitúcia správy kultúrneho dedičstva zdieľa online. V súvislosti s „rozšírenými“ kolektívnymi licenciami je to prakticky aj právne problematické. Prakticky, keďže obmedzuje možnosti opätovného použitia materiálu a kladie dodatočnú záťaž na inštitúciu správy kultúrneho dedičstva. Z právneho hľadiska, pretože je diskutabilné, či organizácia kolektívnej správy s „rozšírenou“ licenciou na kolektívnu správu je držiteľom práv oprávneným vykonávať výnimku z hĺbkovej analýzy údajov.
Ďalšie kroky
My v komunite autorských práv budeme naďalej pozorne sledovať vývoj v tejto oblasti. Zostaňte naladení tým, že sa pripojíte k nášmu Spoločenstvu prostredníctvom združenia Europeana Network Association a budete nás sledovať na sociálnych médiách. Ak sa chcete s nami podeliť o akúkoľvek spätnú väzbu na túto tému, obráťte sa na [email protected].
Viac informácií o vyťažovaní textov a dát nájdete na stránke copyrightuser.org a na transpozičnom portáli Spoločenstva k smernici o CDSM.
