Kan verk och data utvinnas för att träna en algoritm utan att fråga rättighetshavare om tillstånd?
Vår session inleddes med en översikt över de nya rättsliga skyddsåtgärderna som gör text- och datautvinning (TDM) möjlig utan att behöva be rättighetshavare om tillstånd. Dessa skyddsåtgärder infördes genom direktivet om upphovsrätt på den digitala inre marknaden 2019 enligt artiklarna 3 och 4. CDSM-direktivet innehåller inte någon särskild definition av TDM, utan hänvisar till det som ”automatisk beräkningsanalys av information i digital form, såsom text, ljud, bilder eller data”. Som sådan är TDM en metod som underlättar analys och utvinning, till exempel av forskare, av stora mängder data, inklusive upphovsrättsskyddade verk. Denna teknik är en integrerad del av träningsalgoritmer och AI-modeller.
Direktivet tillåter TDM-verksamhet som bedrivs av ”forskningsorganisationer och kulturarvsinstitutioner” för vetenskaplig forskning. Dessa institutioner kan utvinna upphovsrättsskyddade verk eller extrahera data från en databas som de har laglig tillgång till utan att behöva rättsinnehavarnas tillstånd, och utan att rättsinnehavarna kan motsätta sig sådan användning, så länge de utförs för vetenskaplig forskning.
Direktivet gör det också möjligt för enskilda personer och institutioner utöver ”forskningsorganisationer och kulturarvsinstitutioner” att göra mångfaldiganden och utvinningar av verk som de har laglig tillgång till för TDM, oavsett syftet med TDM-verksamheten (därför ingår även eventuella kommersiella syften). Det finns dock en hake: Denna bredare bestämmelse gäller under förutsättning att rättsinnehavarna inte uttryckligen har reserverat sina rättigheter på ett maskinläsbart sätt och uteslutit sina verk från undantagets tillämpningsområde. I ett sådant fall skulle ett företag som TDM utan rättsinnehavarens tillstånd utgöra ett intrång i deras upphovsrätt.
Det finns olika initiativ som undersöker de tekniska medlen för rättighetshavare att reservera sina rättigheter i linje med den andra skyddsåtgärden som nämns ovan, t.ex. initiativet från W3C Community Group, och Have I Been Trained? av Spawning.ai. Deltagarna i vårt evenemang identifierade en betydande utmaning kring svårigheten att säkerställa att de som genomför eller distribuerar TDM tillämpar sådana standarder och respekterar deras användning.
Hur interagerar Creative Commons-licenser med de nya rättsliga garantierna för TDM?
Den roll som Creative Commons (CC) licenser spelar för att underlätta brytning av verk som de gäller diskuterades också under vår session.
CC-licenser är i huvudsak avtal för att tillåta viss användning av upphovsrättsskyddade verk. De står dock inte över de rättsliga garantier som föreskrivs i form av undantag och inskränkningar av upphovsrätten enligt lag. Detta innebär att de inte kan användas för att ytterligare begränsa undantag och inskränkningar i upphovsrätten som föreskrivs i lag och inte heller kan förstås som ett sätt att göra det. En sådan praxis skulle också strida mot syftet med CC-licenser. Inom ramen för den bredare bestämmelse som definierar det rättsliga skyddet för TDM i EU anger CC därför mycket tydligt att villkoren i CC-licenser inte kan tolkas och fungera som en rättighetsreservation (opt-out) av rättighetshavare från denna bredare TDM-skyddsåtgärd.
I linje med resonemanget ovan kan CC-licenser inte heller användas för att åsidosätta vissa undantag och inskränkningar i upphovsrätten. I synnerhet förbjuder lagen varje avtalsrättsligt åsidosättande av det rättsliga skydd som ges till forskningsorganisationer och kulturarvsinstitutioner för TDM. Så om en användning omfattas av denna skyddsåtgärd kommer villkoren i CC-licenserna inte att gälla.
Kan en AI-produktion som genereras eller stöds i EU omfattas av upphovsrättsligt skydd?
Upphovsrättsligt skydd, som ett människocentrerat system, beviljas endast när det finns (mänsklig) originalitet, i betydelsen ”upphovsmannens eget intellektuella uttryck”. Ingenting utesluter möjligheten för en AI-stödd utdata att vara ett upphovsrättsskyddat verk om den mänskliga författaren kunde fatta kreativa beslut, som kan upptäckas i utdata, och därmed utdata är ett originellt uttryck för författaren.
Att skriva en snabbmeddelande skulle i allmänhet inte uppfylla ovanstående krav. Därför kan det sägas att många AI-stödda eller genererade utgångar inte omfattas av upphovsrätten. För närvarande finns det dock endast en doktrinär debatt, men ingen rättspraxis från EU-domstolen som exemplifierar hur man mäter eller identifierar originalitet och mänsklig inblandning i AI-genererade eller assisterade produktioner, eller vem som exakt skulle äga upphovsrätten till ett rent AI-genererat verk, om sådana verk anses vara upphovsrättsskyddade.
Följ med oss på kommande sessioner
Gillade du det här inlägget? Gå sedan med i våra kommande Copyright and Policy Office-tider! Här kan du se en översikt över alla kommande sessioner. Nästa evenemang den 19 juli kommer att fokusera på öppen tillgång, upphovsrätt och etik med diskussioner om skärningspunkten mellan bristen på upphovsrättsliga begränsningar och etisk återanvändning.
Om du vill fortsätta den här diskussionen kan du göra det på plattformen inDICEs.
Ansvarsfriskrivning: Observera att varken de diskussioner som ges i Copyright Office Hours eller i detta inlägg utgör någon juridisk rådgivning.
