Bestemmelserne om tekst- og datamining
I 2019 gjorde direktivet om ophavsret på det digitale indre marked det muligt for alle at lave kopier og udtrække store mængder ophavsretligt beskyttede data, som de har lovlig adgang til uden tilladelse fra rettighedshaveren, med henblik på at udføre dataminingaktiviteter. Dette er muligt, medmindre rettighedshaveren udtrykkeligt vælger at "fravælge" udvindingen af de ophavsretligt beskyttede data (ved hjælp af maskinlæsbare midler). Denne fravalgsmulighed gælder ikke for kulturarvs- og forskningsinstitutioners datamining til forskningsformål. På det tidspunkt var tekst- og datamining ikke noget nyt i andre dele af verden, og Den Europæiske Union led under en konkurrencemæssig ulempe ved ikke at have juridisk klarhed i sin jurisdiktion.
Disse bestemmelser skal sikre, at ophavsretten ikke står i vejen for de muligheder, som analyse af store mængder data giver forsknings- og kulturarvssektoren i Den Europæiske Union (ved i væsentlig grad at forbedre analysen og tilgængeligheden af information) og for informationssamfundet som helhed.
Blokering af dataudvinding fra kulturarvsdata
I 2019 gik kulturarvsinstitutioner, der gik ind for demokratisk adgang til information, ind for undtagelserne for tekst- og datamining. Det var derfor uventet, at de samme institutioner ville overveje at gøre brug af opt-out-muligheden for at blokere minedrift af ophavsretligt beskyttede kulturarvsdata.
Fravalg af denne type behandling har givet anledning til nylige drøftelser i kulturarvssektoren. Det nederlandske nationalbibliotek tilføjede f.eks. en ordlyd til sine vilkår og betingelser, som forbyder alle kommercielle generative AI'er at udvinde bibliotekets ophavsretligt beskyttede værker. Via maskinlæsbare metoder forbyder det udtrykkeligt ChatGPT at høste deres samlinger.
I visse tilfælde synes begrundelsen for at gennemføre en opt-out at være, at rettighedshaverne anmoder om denne opt-out som en betingelse for, at data kan deles via en kulturarvsorganisations websted. Dette gøres undertiden af den enkelte rettighedshaver eller af en kollektiv forvaltningsorganisation som Pictoright i Nederlandene og Sacem i Frankrig. Men nogle gange synes viljen at komme fra selve kulturarvsinstitutionen, der ønsker at sikre, at skabere respekteres gennem en gennemsigtig (tilskrevet) og tilladelsesbaseret brug af deres kreationer.
Blandt de vigtigste argumenter advarer nogle om behovet for at blokere for dataudvinding for at forhindre visse "big tech"-virksomheder, der arbejder med generativ kunstig intelligens, i at udvinde data. Faktisk analyserer nogle store profitorienterede virksomheder store mængder ophavsretligt beskyttede data uden megen gennemsigtighed. De er blevet kritiseret for at pleje sig selv på "fællesmarkedet" (indhold, der er tilgængeligt uden ophavsretlige begrænsninger) uden at bidrage til dem og samtidig styrke deres konkurrencefordel.
Ud over hvad der er juridisk muligt: Hvad bør kulturarvssektoren stå for?
I de fleste tilfælde vil kulturarvsinstitutioner give adgang til materiale, der enten ikke er ophavsretligt beskyttet, eller som er beskyttet, og som rettighedshaverne har givet tilladelse til at offentliggøre online, men som kulturarvsinstitutionen ikke har ophavsretten til. I sådanne tilfælde har kulturarvsinstitutioner ikke ret til at træffe beslutning om at anvende en fravalgsordning for datamining. De kan kun gøre det, hvis der er ophavsret, og de har ophavsretten.
Men selv hvis de gør, er det værd at undre sig over, om fravalg understøtter deres mål. Blokering af muligheden for at anvende kulturarvsdata synes på en måde at være i strid med offentligt finansierede kulturarvsinstitutioners mission. Er det ikke mere i overensstemmelse med deres mål at bidrage med pålidelige kvalitative oplysninger og bekæmpe misinformation og bias (i algoritmer)?
Når det kommer til at rette op på den dårlige praksis hos nogle store aktører i AI-verdenen, ville fravalg af kulturarvsdata faktisk svække dem? Big tech-virksomheder kan tage juridiske risici, betale en bøde eller betale prisen for lovligt minedrift af data. Udelukkelse af kulturarvsdata vil ikke forhindre dem i at bruge dem, men vil sandsynligvis i stedet have en negativ indvirkning på SMV'er, journalister, fagfolk inden for kulturarv og forskere selv, der bruger dataene, og også værktøjerne både til forskningsformål, men også mere generelle formål. Det risikerer at svække dem, der har mest brug for det fælles. Grænserne mellem handel og forskning bliver stadig mere vage. Hvor trækker vi grænsen?
Bør kulturarvsinstitutioner skabe lige vilkår og sikre åben adgang til kulturelt indhold for alle, også ved hjælp af maskiner? Hvis der ikke findes eller anvendes opt-out-løsninger, der er egnede til at blive anvendt punkt for punkt, er der en klar risiko for, at anvendelsen af en maskinlæsbar opt-out vil overløbe offentligt materiale, der gøres tilgængeligt online.
Sagen om værker, der ikke længere forhandles
Med ovennævnte ophavsretsdirektiv blev systemet med værker, der ikke længere forhandles, vedtaget: en ny retlig løsning, hvorigennem kulturarvsinstitutioner kan dele materialer online i deres samlinger, der ikke (eller ikke længere) er i kommerciel omsætning, selv om de er omfattet af ophavsretlig beskyttelse, uden tilladelse fra indehaveren af ophavsretten. Dette nye system fjerner den (umulige) byrde ved clearing af ophavsret i store samlinger.
Dette kræver generelt, at der indhentes en licens fra en kollektiv forvaltningsorganisation, som er repræsentativ for de pågældende materialetyper. Gennem direktivet har organisationerne ret til at udstede "udvidede" kollektive licenser: de kan give kulturarvsinstitutioner tilladelse til at anvende materialer, der er en del af den kollektive forvaltningsorganisations repertoire, men også materialer, der ikke er.
Nogle kollektive forvaltningsorganisationer omfatter en forpligtelse til at "fravælge", at disse værker, der ikke længere forhandles, udvindes, når de deles online af kulturarvsinstitutionen. I forbindelse med "udvidede" kollektive licenser er dette både praktisk og juridisk problematisk. Praktisk talt, da det begrænser materialets genanvendelsesmuligheder og lægger en yderligere byrde på kulturarvsinstitutionen. Juridisk set, fordi det kan diskuteres, om en kollektiv forvaltningsorganisation i en "udvidet" kollektiv forvaltningslicens er rettighedshaveren, der har ret til at udøve en fravalgsmulighed for datamining.
Næste skridt
Vi i ophavsretsfællesskabet vil fortsat følge udviklingen på dette område nøje. Følg med i vores fællesskab gennem Europeana Network Association og følg os på de sociale medier. Hvis du ønsker at dele feedback om dette emne med os, bedes du kontakte [email protected].
Du kan læse mere om tekst- og datamining på copyrightuser.org og på Communia CDSM Directive transposition portal.
