Določbe o besedilnem in podatkovnem rudarjenju
Leta 2019 je direktiva o avtorskih pravicah na enotnem digitalnem trgu vsakomur omogočila, da brez dovoljenja imetnika pravic naredi kopije in izvleče velike količine podatkov, zaščitenih z avtorskimi pravicami, do katerih ima zakonit dostop, za izvajanje dejavnosti podatkovnega rudarjenja. To je mogoče, razen če se imetnik pravic izrecno odloči, da podatkov, zaščitenih z avtorskimi pravicami (prek strojno berljivih sredstev), ne bo kopal. Ta možnost izvzetja se ne uporablja za podatkovno rudarjenje, ki ga izvajajo kulturna dediščina in raziskovalne ustanove za raziskovalne namene. Takrat besedilno in podatkovno rudarjenje v drugih delih sveta ni bilo novo, Evropska unija pa je bila v slabšem konkurenčnem položaju, ker v svoji jurisdikciji ni imela pravne jasnosti.
Namen teh določb je zagotoviti, da avtorske pravice ne bodo ovirale priložnosti, ki jih analiza velikih količin podatkov prinaša raziskovalnim sektorjem in sektorjem kulturne dediščine v Evropski uniji (z bistvenim izboljšanjem analize in odkrivnosti informacij) ter informacijski družbi na splošno.
Blokiranje podatkovnega rudarjenja iz podatkov o kulturni dediščini
Ustanove za varstvo kulturne dediščine, ki so se zavzemale za demokratični dostop do informacij, so leta 2019 podprle izjeme v zvezi z besedilnim in podatkovnim rudarjenjem. Zato je bilo nepričakovano, da bi te iste institucije razmislile o uporabi možnosti izvzetja za blokiranje rudarjenja podatkov o zaščiteni kulturni dediščini, zaščitenih z avtorskimi pravicami.
Nedavne razprave v sektorju kulturne dediščine so sprožile zavrnitev tovrstne obdelave. Nizozemska nacionalna knjižnica je na primer svojim pogojem dodala besedilo, ki prepoveduje vse komercialne generativne umetne inteligence za pridobivanje avtorsko zaščitenih del knjižnice. S strojno berljivimi metodami izrecno prepoveduje ChatGPT nabiranje svojih zbirk.
V nekaterih primerih se zdi, da je razlog za izvajanje izvzetja ta, da imetniki avtorskih pravic zahtevajo to izvzetje kot pogoj za izmenjavo podatkov prek spletišča organizacije za varstvo kulturne dediščine. To včasih stori posamezni imetnik pravic ali organizacija za kolektivno upravljanje pravic, kot sta Pictoright na Nizozemskem in Sacem v Franciji. Toda včasih se zdi, da pripravljenost prihaja od same ustanove za kulturno dediščino, ki želi zagotoviti, da se ustvarjalci spoštujejo s pregledno (pripisano) uporabo njihovih stvaritev na podlagi dovoljenj.
Med glavnimi argumenti nekateri opozarjajo, da je treba blokirati rudarjenje podatkov, da bi nekaterim „velikim tehnološkim“ podjetjem, ki delajo z generativno umetno inteligenco, preprečili rudarjenje podatkov. Dejansko nekatera velika pridobitna podjetja analizirajo velike količine podatkov, zaščitenih z avtorskimi pravicami, brez velike preglednosti. Kritizirani so bili, ker so sami negovali „skupne“ (vsebine, ki so na voljo brez omejitev avtorskih pravic), ne da bi k temu prispevali in hkrati okrepili svojo konkurenčno prednost.
Poleg tega, kar je pravno mogoče: za kaj bi se moral zavzemati sektor dediščine?
Ustanove za varstvo kulturne dediščine bodo v večini primerov omogočile dostop do gradiv, ki niso zaščitena z avtorskimi pravicami ali so zaščitena in za katera so imetniki pravic dovolili objavo na spletu, vendar zanje ustanova za varstvo kulturne dediščine nima avtorskih pravic. V takih primerih ustanove za varstvo kulturne dediščine niso upravičene do odločitve o uporabi izvzetja iz podatkovnega rudarjenja. To lahko storijo le, če obstajajo avtorske pravice in imajo avtorske pravice.
Toda tudi če to storijo, se je vredno spraševati, ali zavrnitev podpira njihove cilje. Blokiranje možnosti uporabe podatkov o kulturni dediščini se na nek način zdi v nasprotju s poslanstvom javno financiranih ustanov za varstvo kulturne dediščine. Ali ni prispevanje zaupanja vrednih kvalitativnih informacij ter boj proti napačnim informacijam in pristranskosti (v algoritmih) bolj v skladu z njihovimi cilji?
Ali bi izločitev podatkov o kulturni dediščini dejansko oslabila slabo prakso nekaterih velikih akterjev v svetu umetne inteligence? Velika tehnološka podjetja lahko prevzamejo pravna tveganja, plačajo globo ali plačajo ceno za zakonito rudarjenje podatkov. Izključitev podatkov o kulturni dediščini jim ne bo preprečila njihove uporabe, temveč bo verjetno negativno vplivala na MSP, novinarje, strokovnjake za kulturno dediščino in same raziskovalce, ki uporabljajo podatke, pa tudi na orodja za raziskave in splošnejše namene. To lahko oslabi tiste, ki najbolj potrebujejo skupne dobrine. Meje med komercialnimi in raziskovalnimi dejavnostmi so vse bolj nejasne. Kje potegnemo črto?
Ali bi morale ustanove za varstvo kulturne dediščine zagotoviti enake konkurenčne pogoje in vsem, tudi strojem, omogočiti prost dostop do kulturnih vsebin? Če ni na voljo ali se ne uporabljajo rešitve opt-out, ki bi bile primerne za uporabo za vsako postavko posebej, obstaja očitno tveganje, da se bo uporaba strojno berljive rešitve opt-out razširila na javno dostopno gradivo, ki je na voljo na spletu.
Primer razprodanih del
Z zgoraj navedeno direktivo o avtorskih pravicah je bil sprejet sistem razprodanih del: nova pravna rešitev, s katero lahko ustanove za varstvo kulturne dediščine na spletu delijo gradivo v svojih zbirkah, ki ni (ali ni več) v komercialnem obtoku, čeprav je zaščiteno z avtorskimi pravicami, brez dovoljenja imetnika avtorskih pravic. Ta novi sistem odpravlja (nemogoče) breme čiščenja avtorskih pravic v velikih zbirkah.
To na splošno zahteva pridobitev licence organizacije za kolektivno upravljanje pravic, ki je reprezentativna za vrste zadevnega gradiva. Na podlagi Direktive lahko organizacije izdajajo „podaljšane“ kolektivne licence: ustanovam za varstvo kulturne dediščine lahko dovolijo uporabo gradiva, ki je del repertoarja organizacije za kolektivno upravljanje pravic, pa tudi gradiva, ki ni del tega repertoarja.
Nekatere organizacije za kolektivno upravljanje pravic vključujejo obveznost izvzetja teh razprodanih del iz rudarjenja, kadar jih ustanova za varstvo kulturne dediščine deli prek spleta. V okviru „razširjenega“ kolektivnega licenciranja je to praktično in pravno problematično. Praktično, saj omejuje možnosti ponovne uporabe gradiva in dodatno obremenjuje ustanovo za varstvo kulturne dediščine. Pravno, ker je vprašljivo, ali je organizacija za kolektivno upravljanje pravic v „razširjeni“ licenci za kolektivno upravljanje pravic imetnik pravic, ki ima pravico do izvzetja iz podatkovnega rudarjenja.
Naslednji koraki
V skupnosti za avtorske pravice bomo še naprej pozorno spremljali razvoj na tem področju. Pridružite se naši skupnosti prek združenja Europeana Network Association in nas spremljajte na družbenih medijih. Če želite z nami deliti kakršne koli povratne informacije o tej temi, nam pišite na naslov [email protected].
Več o besedilnem in podatkovnem rudarjenju lahko preberete na copyrightuser.org in na portalu Communia CDSM za prenos direktive.
