Bestämmelserna om text- och datautvinning
År 2019 gjorde direktivet om upphovsrätt i den digitala inre marknaden det möjligt för vem som helst att göra kopior och extrahera stora mängder upphovsrättsskyddade data som de har laglig tillgång till utan tillstånd från rättsinnehavaren, för att bedriva datautvinningsverksamhet. Detta är möjligt om inte rättsinnehavaren uttryckligen väljer att ”välja bort” att de upphovsrättsskyddade uppgifterna (på maskinläsbart sätt) utvinns. Denna möjlighet till undantag gäller inte för datautvinning som utförs av kulturarvs- och forskningsinstitutioner för forskningsändamål. På den tiden var text- och datautvinning inte något nytt i andra delar av världen, och Europeiska unionen drabbades av en konkurrensnackdel genom att inte ha rättslig klarhet i sin jurisdiktion.
Syftet med dessa bestämmelser är att se till att upphovsrätten inte står i vägen för de möjligheter som analysen av stora datamängder innebär för forsknings- och kulturarvssektorerna i Europeiska unionen (genom att avsevärt förbättra informationens analys och upptäckbarhet) och för informationssamhället i stort.
Blockera datautvinning från kulturarvsdata
Under 2019 förespråkade kulturarvsinstitutioner, som förespråkade demokratisk tillgång till information, undantagen för text- och datautvinning. Det var därför oväntat att samma institutioner skulle överväga att utnyttja möjligheten till undantag för att blockera utvinning av upphovsrättsskyddade kulturarvsdata.
Att välja bort denna typ av behandling har gett upphov till diskussioner på senare tid inom kulturarvssektorn. Nederländernas nationalbibliotek lade till exempel till formuleringar i sina villkor som förbjuder alla kommersiella generativa artificiella intelligenser att utvinna bibliotekets upphovsrättsskyddade verk. Via maskinläsbara metoder förbjuder det uttryckligen ChatGPT att skörda sina samlingar.
I vissa fall verkar skälet till att genomföra en undantagsklausul vara att upphovsrättsinnehavare begär denna undantagsklausul som ett villkor för att uppgifter ska kunna delas via en kulturarvsorganisations webbplats. Detta görs ibland av den enskilde rättighetshavaren eller av en kollektiv förvaltningsorganisation, såsom Pictoright i Nederländerna och Sacem i Frankrike. Men ibland verkar viljan komma från kulturarvsinstitutionen själv, som vill se till att skaparna respekteras genom en transparent (tilldelad) och tillståndsbaserad användning av sina skapelser.
Bland de viktigaste argumenten varnar vissa för behovet av att blockera datautvinning för att stoppa vissa ”storteknologiska” företag som arbetar med generativ AI från att utvinna data. Vissa stora vinstdrivande företag analyserar stora mängder upphovsrättsskyddade uppgifter utan större insyn. De har kritiserats för att vårda sig om de ”allmänna” (innehåll som är tillgängligt utan upphovsrättsliga restriktioner) utan att bidra tillbaka till dem och samtidigt stärka sin konkurrensfördel.
Utöver vad som är juridiskt möjligt: Vad bör kulturarvssektorn stå för?
I de flesta fall kommer kulturarvsinstitutioner att ge tillgång till material som antingen inte är upphovsrättsskyddat eller som är skyddat och för vilket rättighetshavarna har godkänt att materialet läggs ut på nätet, men för vilket kulturarvsinstitutionen inte innehar upphovsrätten. I sådana fall har kulturarvsinstitutioner inte rätt att fatta beslut om att tillämpa undantag för datautvinning. De kan bara göra det om upphovsrätten finns, och de innehar upphovsrätten.
Men även om de gör det är det värt att undra om att välja bort stöder deras mål. Att blockera möjligheten att använda kulturarvsdata verkar på sätt och vis strida mot uppdraget för offentligt finansierade kulturarvsinstitutioner. Är det inte mer i linje med målen att bidra med tillförlitlig kvalitativ information och bekämpa felaktig information och partiskhet (i algoritmer)?
När det gäller att korrigera den dåliga praxisen hos vissa stora aktörer i AI-världen, skulle opt-out kulturarvsdata faktiskt försvaga dem? Big tech-företag kan ta juridiska risker, betala böter eller betala priset för att lagligt bryta data. Att undanta kulturarvsdata kommer inte att hindra dem från att använda dem, utan kommer sannolikt i stället att ha en negativ inverkan på små och medelstora företag, journalister, yrkesverksamma på kulturarvsområdet och forskarna själva som använder uppgifterna, och även på verktygen både för forskning men även för mer allmänna ändamål. Det riskerar att försvaga dem som behöver det gemensamma mest. Gränserna mellan handel och forskning blir allt vagare. Var drar vi gränsen?
Bör kulturarvsinstitutioner skapa lika villkor och garantera öppen tillgång till kulturellt innehåll för alla, även för maskiner? Om det inte finns några tillgängliga eller använda opt-out-lösningar som är lämpliga att tillämpa på en artikel för artikel finns det en tydlig risk för att tillämpningen av en maskinläsbar opt-out kommer att flöda över offentligt material som görs tillgängligt online.
Fallet med utgångna verk
Med det ovannämnda upphovsrättsdirektivet antogs systemet med utgångna verk: En ny rättslig lösning genom vilken kulturarvsinstitutioner kan dela material på nätet i sina samlingar som inte (eller inte längre) är i kommersiell omsättning, trots att de omfattas av upphovsrättsligt skydd, utan tillstånd från upphovsrättsinnehavaren. Detta nya system tar bort den (omöjliga) bördan att rensa upphovsrätten i stora samlingar.
För detta krävs i allmänhet en licens från en kollektiv förvaltningsorganisation som är representativ för de berörda materialtyperna. Genom direktivet har organisationerna rätt att utfärda ”utökade” kollektiva licenser: De kan ge kulturarvsinstitutioner tillstånd att använda material som ingår i den kollektiva förvaltningsorganisationens repertoar, men även material som inte gör det.
Vissa kollektiva förvaltningsorganisationer har en skyldighet att ”opt-out” dessa utgångna verk från att utvinnas när de delas online av kulturarvsinstitutionen. När det gäller ”utökad” kollektiv licensiering är detta både praktiskt och rättsligt problematiskt. Praktiskt taget eftersom det begränsar möjligheterna till återanvändning av materialet och lägger en extra börda på kulturarvsinstitutionen. Juridiskt sett, eftersom det är diskutabelt huruvida en kollektiv förvaltningsorganisation i en ”utökad” licens för kollektiv förvaltning är rättighetshavare som har rätt att utnyttja ett undantag för datautvinning.
Nästa steg
Vi i upphovsrättsgemenskapen kommer att fortsätta att noga följa utvecklingen på detta område. Håll dig uppdaterad genom att gå med i vår gemenskap genom Europeana Network Association och följa oss på sociala medier. Om du vill dela med dig av dina synpunkter på detta ämne kan du kontakta [email protected].
Du kan läsa mer om text- och datautvinning på copyrightuser.org och på Communia CDSM Directive transposition portal.
