Odredbe o rudarenju teksta i podataka
Direktivom o autorskim pravima na jedinstvenom digitalnom tržištu iz 2019. svima je omogućeno da bez dopuštenja nositelja prava izrađuju kopije i izvlače velike količine podataka zaštićenih autorskim pravom kojima imaju zakonit pristup kako bi obavljali aktivnosti rudarenja podataka. To je moguće, osim ako nositelj prava izričito odluči „odustati” od rudarenja podataka zaštićenih autorskim pravom (putem strojno čitljivih sredstava). Ta mogućnost izuzeća ne primjenjuje se na rudarenje podataka koje provode kulturne baštine i istraživačke institucije u istraživačke svrhe. U to vrijeme rudarenje teksta i podataka nije bilo novo u drugim dijelovima svijeta, a Europska unija bila je u nepovoljnom položaju u odnosu na konkurenciju jer nije imala pravnu jasnoću u svojoj nadležnosti.
Tim se odredbama nastoji osigurati da autorska prava ne ometaju mogućnosti koje analiza velikih količina podataka pruža sektorima istraživanja i kulturne baštine u Europskoj uniji (znatnim poboljšanjem analize i mogućnosti otkrivanja informacija) te informacijskom društvu u cjelini.
Blokiranje rudarenja podataka iz podataka o kulturnoj baštini
Institucije kulturne baštine koje su se 2019. zalagale za demokratski pristup informacijama zalagale su se za iznimke u pogledu rudarenja teksta i podataka. Stoga je bilo neočekivano da te iste institucije razmotre mogućnost izuzeća kako bi blokirale rudarenje podataka o kulturnoj baštini zaštićenih autorskim pravima.
Nesudjelovanje u takvoj vrsti obrade potaknulo je nedavne rasprave u sektoru kulturne baštine. Nacionalna knjižnica Nizozemske, na primjer, dodala je tekst u svoje uvjete poslovanja kojim se zabranjuje da svi komercijalni generativni UI-ji iskopaju djela knjižnice zaštićena autorskim pravom. Putem strojno čitljivih metoda, izričito zabranjuje ChatGPT-u žetvu svojih zbirki.
U određenim slučajevima čini se da je razlog za provedbu izuzeća taj što nositelji autorskih prava traže to izuzeće kao uvjet za razmjenu podataka putem internetske stranice organizacije za kulturnu baštinu. To ponekad čine pojedinačni nositelji prava ili organizacija za kolektivno ostvarivanje prava, kao što su Pictoright u Nizozemskoj i Sacem u Francuskoj. No, ponekad se čini da spremnost dolazi od same institucije kulturne baštine, želeći osigurati da se stvaratelji poštuju transparentnim (pripisivim) korištenjem njihovih djela na temelju dopuštenja.
Neki od glavnih argumenata upozoravaju na potrebu za blokiranjem rudarenja podataka kako bi se određena „velika tehnološka” poduzeća koja rade s generativnom umjetnom inteligencijom zaustavila u rudarenju podataka. Doista, neka velika profitna poduzeća bez velike transparentnosti analiziraju velike količine podataka zaštićenih autorskim pravima. Kritizirani su zbog njegovanja „zajednica” (sadržaja dostupnog bez ograničenja autorskih prava), a da im pritom nisu pridonijeli, čime su ojačali svoju konkurentsku prednost.
Osim onoga što je pravno moguće: Što bi trebao biti sektor baštine?
U većini slučajeva institucije kulturne baštine omogućit će pristup materijalima koji nisu zaštićeni autorskim pravom ili su zaštićeni i za koje su nositelji prava odobrili objavljivanje na internetu, ali za koje institucija kulturne baštine nema autorsko pravo. U takvim slučajevima institucije kulturne baštine nemaju pravo donijeti odluku o primjeni izuzeća za rudarenje podataka. To mogu učiniti samo ako postoji autorsko pravo i ako su nositelji autorskog prava.
Ali čak i ako to učine, vrijedi se zapitati podržava li isključivanje njihove ciljeve. Na neki se način čini da je blokiranje mogućnosti upotrebe podataka o kulturnoj baštini u suprotnosti s misijom javno financiranih institucija kulturne baštine. Nije li doprinos pouzdanim kvalitativnim informacijama i borba protiv pogrešnih informacija i pristranosti (u algoritmima) u većoj mjeri u skladu s njihovim ciljevima?
Kada je riječ o ispravljanju loše prakse nekih velikih aktera u svijetu umjetne inteligencije, bi li ih isključivanje podataka o kulturnoj baštini zapravo oslabilo? Velike tehnološke tvrtke mogu preuzeti pravne rizike, platiti novčanu kaznu ili platiti cijenu za zakonito rudarenje podataka. Isključivanje podataka o kulturnoj baštini neće ih spriječiti da ih upotrebljavaju, već će vjerojatno negativno utjecati na MSP-ove, novinare, stručnjake za kulturnu baštinu i same istraživače koji te podatke upotrebljavaju, kao i na alate u istraživačke, ali i općenitije svrhe. To bi moglo oslabiti one kojima je najpotrebnije zajedničko dobro. Granice između trgovine i istraživanja sve su nejasnije. Gdje ćemo povući crtu?
Trebaju li institucije kulturne baštine osigurati jednake uvjete i svima, pa i strojevima, osigurati otvoren pristup kulturnim sadržajima? Ako ne postoje dostupna ili korištena rješenja za isključivanje koja su prikladna za primjenu na temelju stavki po stavkama, postoji jasan rizik da će primjena strojno čitljivog izuzeća pretjecati na materijal javne domene koji je dostupan na internetu.
Slučaj nedostupnih djela
S prethodno navedenom direktivom o autorskom pravu donesen je sustav nedostupnih djela: novo pravno rješenje putem kojeg institucije kulturne baštine mogu dijeliti materijale na internetu u svojim zbirkama koje nisu (ili više nisu) u komercijalnom optjecaju, iako podliježu zaštiti autorskih prava, bez dopuštenja nositelja autorskih prava. Tim se novim sustavom uklanja (nemogući) teret uklanjanja autorskih prava u velikim zbirkama.
To općenito zahtijeva dobivanje licencije od organizacije za kolektivno ostvarivanje prava koja je reprezentativna za predmetne vrste materijala. Na temelju Direktive organizacije imaju pravo izdavati „proširene” kolektivne licencije: mogu ovlastiti institucije kulturne baštine da upotrebljavaju materijale koji su dio repertoara organizacije za kolektivno ostvarivanje prava, ali i materijale koji to nisu.
Neke organizacije za kolektivno ostvarivanje prava uključuju obvezu „odustanka” od rudarenja tih nedostupnih djela ako ih institucija kulturne baštine dijeli na internetu. U kontekstu „proširenog” kolektivnog licenciranja to je praktički i pravno problematično. Praktički, jer ograničava mogućnosti ponovne uporabe materijala i dodatno opterećuje instituciju kulturne baštine. Pravno, jer je sporno je li organizacija za kolektivno ostvarivanje prava koja ima „proširenu” dozvolu za kolektivno ostvarivanje prava nositelj prava koji ima pravo iskoristiti izuzeće u pogledu rudarenja podataka.
Sljedeći koraci
Mi u Zajednici za autorska prava nastavit ćemo pomno pratiti razvoj događaja u tom području. Pridružite se našoj zajednici putem udruge Europeana Network i pratite nas na društvenim mrežama. Ako želite s nama podijeliti povratne informacije o ovoj temi, obratite nam se na [email protected].
Više o rudarenju teksta i podataka možete pročitati na copyrightuser.org i na portalu za prenošenje Direktive o CDSM-u Communia.
