Disposizioni in materia di estrazione di testo e di dati
Nel 2019 la direttiva sul diritto d'autore nel mercato unico digitale ha consentito a chiunque di fare copie ed estrarre grandi quantità di dati protetti dal diritto d'autore ai quali ha accesso legalmente senza l'autorizzazione del titolare dei diritti, al fine di svolgere attività di estrazione di dati. Ciò è possibile a meno che il titolare dei diritti non scelga espressamente di "rifiutare" l'estrazione dei dati protetti dal diritto d'autore (attraverso mezzi leggibili meccanicamente). Questa possibilità di opt-out non si applica all'estrazione di dati da parte di istituti di ricerca e di tutela del patrimonio culturale a fini di ricerca. All'epoca, l'estrazione di testo e di dati non era una novità in altre parti del mondo e l'Unione europea soffriva di uno svantaggio competitivo in quanto non aveva chiarezza giuridica nella sua giurisdizione.
Tali disposizioni mirano a garantire che il diritto d'autore non ostacoli le opportunità che l'analisi di grandi quantità di dati offre ai settori della ricerca e del patrimonio culturale nell'Unione europea (migliorando sostanzialmente l'analisi e la reperibilità delle informazioni) e alla società dell'informazione in generale.
Blocco dell'estrazione di dati dai dati sul patrimonio culturale
Nel 2019 gli istituti di tutela del patrimonio culturale, sostenendo l'accesso democratico alle informazioni, si sono espressi a favore delle eccezioni all'estrazione di testo e di dati. Era quindi inaspettato che queste stesse istituzioni prendessero in considerazione la possibilità di avvalersi della possibilità di opt-out per bloccare l'estrazione di dati sul patrimonio culturale protetti dal diritto d'autore.
La rinuncia a questo tipo di trattamento ha sollevato recenti discussioni nel settore del patrimonio culturale. La Biblioteca nazionale dei Paesi Bassi, ad esempio, ha aggiunto una formulazione ai suoi termini e condizioni che vieta a tutte le IA generative commerciali di estrarre le opere protette dal diritto d’autore della biblioteca. Attraverso metodi leggibili dalla macchina, vieta esplicitamente a ChatGPT di raccogliere le loro collezioni.
In alcuni casi, il motivo per l'attuazione di una clausola di non partecipazione sembra essere il fatto che i titolari dei diritti d'autore chiedono tale clausola di non partecipazione come condizione per la condivisione dei dati attraverso il sito web di un'organizzazione per il patrimonio culturale. A volte ciò viene fatto dal singolo titolare dei diritti o da un organismo di gestione collettiva, come Pictoright nei Paesi Bassi e Sacem in Francia. Ma a volte la volontà sembra provenire dalla stessa istituzione del patrimonio culturale, volendo garantire che i creatori siano rispettati attraverso un uso trasparente (attribuito) e basato sul permesso delle loro creazioni.
Tra le principali argomentazioni, alcune mettono in guardia dalla necessità di bloccare l'estrazione di dati per impedire ad alcune imprese "big tech" che lavorano con l'IA generativa di estrarre dati. In effetti, alcune grandi aziende a scopo di lucro analizzano grandi quantità di dati protetti da copyright senza molta trasparenza. Sono stati criticati per essersi nutriti dei "commons" (contenuti disponibili senza restrizioni del diritto d'autore) senza contribuirvi, rafforzando nel contempo il loro vantaggio competitivo.
Al di là di ciò che è legalmente possibile: cosa dovrebbe rappresentare il settore del patrimonio culturale?
Nella maggior parte dei casi, gli istituti di tutela del patrimonio culturale daranno accesso a materiali che non sono protetti dal diritto d'autore o che sono protetti e per i quali i titolari dei diritti hanno autorizzato la pubblicazione online, ma per i quali l'istituto di tutela del patrimonio culturale non detiene il diritto d'autore. In tali casi, gli istituti di tutela del patrimonio culturale non sono autorizzati a prendere la decisione di applicare l'opt-out per l'estrazione di dati. Possono farlo solo se esiste il diritto d'autore e detengono il diritto d'autore.
Ma anche se lo fanno, vale la pena chiedersi se l'opt-out supporta i loro obiettivi. In un certo senso, bloccare la possibilità di utilizzare i dati sul patrimonio culturale sembra in contrasto con la missione degli istituti di tutela del patrimonio culturale finanziati con fondi pubblici. Il contributo di informazioni qualitative affidabili e la lotta contro la disinformazione e i pregiudizi (negli algoritmi) non sono più in linea con i loro obiettivi?
Quando si tratta di correggere le cattive pratiche di alcuni grandi attori nel mondo dell'intelligenza artificiale, l'opt-out dei dati sul patrimonio culturale li indebolirebbe effettivamente? Le grandi aziende tecnologiche possono correre rischi legali, pagare una multa o pagare il prezzo per estrarre legalmente i dati. L'esclusione dei dati sul patrimonio culturale non impedirà loro di utilizzarli, ma probabilmente avrà invece un impatto negativo sulle PMI, sui giornalisti, sui professionisti del patrimonio culturale e sui ricercatori stessi che utilizzano i dati, nonché sugli strumenti sia per scopi di ricerca che per scopi più generali. Rischia di indebolire coloro che hanno più bisogno dei beni comuni. I confini tra commercio e ricerca sono sempre più vaghi. Dove tracciamo la linea?
Gli istituti di tutela del patrimonio culturale dovrebbero creare condizioni di parità e salvaguardare l'accesso aperto ai contenuti culturali da parte di tutti, anche da parte delle macchine? Se non sono disponibili o utilizzate soluzioni di opt-out adatte a essere applicate su base analitica, vi è il chiaro rischio che l'applicazione di un opt-out leggibile meccanicamente trabocchi sul materiale di pubblico dominio reso disponibile online.
Il caso delle opere fuori commercio
Con la direttiva sul diritto d'autore di cui sopra, è stato adottato il sistema delle opere fuori commercio: una nuova soluzione giuridica attraverso la quale gli istituti di tutela del patrimonio culturale possono condividere online nelle loro collezioni materiali che non sono (o non sono più) in circolazione commerciale, anche se sono soggetti alla protezione del diritto d'autore, senza l'autorizzazione del titolare del diritto d'autore. Questo nuovo sistema rimuove l'onere (impossibile) della compensazione del copyright nelle grandi collezioni.
Ciò richiede in genere l'ottenimento di una licenza da parte di un organismo di gestione collettiva, che sia rappresentativo dei tipi di materiali in questione. Attraverso la direttiva, le organizzazioni hanno il diritto di concedere licenze collettive «estese»: possono autorizzare gli istituti di tutela del patrimonio culturale a utilizzare materiali che fanno parte del repertorio dell'organismo di gestione collettiva, ma anche materiali che non lo sono.
Alcuni organismi di gestione collettiva prevedono l'obbligo di "opt-out" dall'estrazione di queste opere fuori commercio, se condivise online dall'istituto di tutela del patrimonio culturale. Nel contesto delle licenze collettive "estese", ciò è problematico sia dal punto di vista pratico che giuridico. In pratica, in quanto limita le possibilità di riutilizzo del materiale e impone un onere aggiuntivo all'istituto di tutela del patrimonio culturale. Dal punto di vista giuridico, poiché è discutibile se un organismo di gestione collettiva in una licenza di gestione collettiva «estesa» sia il titolare dei diritti autorizzato a esercitare un’opzione di esclusione dall’estrazione di dati.
Prossime tappe
Noi della comunità dei diritti d'autore continueremo a seguire da vicino gli sviluppi in questo settore. Restate sintonizzati entrando a far parte della nostra Comunità attraverso l'Associazione Europeana Network e seguendoci sui social media. Se desideri condividere con noi qualsiasi feedback su questo argomento, ti preghiamo di contattare [email protected].
Ulteriori informazioni sull'estrazione di testo e di dati sono disponibili sul sito copyrightuser.org e sul portale di recepimento della direttiva CDSM della Communia.
