È possibile estrarre opere e dati per addestrare un algoritmo senza chiedere l'autorizzazione ai titolari dei diritti?
La nostra sessione è iniziata con una panoramica delle nuove garanzie legali che rendono possibile il text and data mining (TDM) senza la necessità di chiedere l'autorizzazione ai titolari dei diritti. Tali garanzie sono state introdotte dalla direttiva sul diritto d'autore nel mercato unico digitale (CDSM) nel 2019 a norma degli articoli 3 e 4. La direttiva CDSM non fornisce una definizione particolare di TDM, ma la definisce come «analisi computazionale automatizzata di informazioni in forma digitale, come testo, suoni, immagini o dati». In quanto tale, il TDM è un metodo che facilita l’analisi e l’estrazione, ad esempio da parte dei ricercatori, di grandi quantità di dati, comprese le opere protette dal diritto d’autore. Questa tecnica è parte integrante degli algoritmi di allenamento e dei modelli di IA.
La direttiva autorizza le attività di TDM svolte da «organismi di ricerca e istituti di tutela del patrimonio culturale» ai fini della ricerca scientifica. Tali istituzioni possono estrarre opere protette dal diritto d'autore o estrarre dati da una banca dati alla quale hanno legalmente accesso senza bisogno dell'autorizzazione dei titolari dei diritti e senza che i titolari dei diritti possano opporsi a tali usi, purché siano effettuati a fini di ricerca scientifica.
La direttiva consente inoltre alle persone fisiche e alle istituzioni al di là degli «organismi di ricerca e istituti di tutela del patrimonio culturale» di effettuare riproduzioni ed estrazioni di opere alle quali hanno legalmente accesso per la TDM, indipendentemente dallo scopo alla base delle attività della TDM (quindi sono inclusi anche eventuali scopi commerciali). Tuttavia, c'è una cattura: questa disposizione più ampia si applica a condizione che i titolari dei diritti non abbiano espressamente riservato i loro diritti, in modo leggibile meccanicamente, ed escluso le loro opere dall'ambito di applicazione dell'eccezione. In tal caso, l’assunzione della TDM senza l’autorizzazione del titolare dei diritti costituirebbe una violazione del suo diritto d’autore.
Ci sono varie iniziative che esaminano i mezzi tecnici per i titolari dei diritti per riservare i loro diritti in linea con la seconda salvaguardia di cui sopra, come l'iniziativa del W3C Community Group, e Have I Been Trained? by Spawning.ai. I partecipanti al nostro evento hanno identificato una sfida significativa intorno alla difficoltà di garantire che coloro che conducono o implementano TDM applichino tali standard e rispettino il loro utilizzo.
In che modo le licenze Creative Commons interagiscono con le nuove garanzie legali per TDM?
Anche il ruolo delle licenze Creative Commons (CC) nel facilitare l'estrazione di opere a cui si applicano è stato discusso nella nostra sessione.
Le licenze CC sono, in sostanza, contratti per consentire determinati usi di opere protette da copyright. Tuttavia, non sono al di sopra delle garanzie legali fornite sotto forma di eccezioni e limitazioni al diritto d'autore dalla legge. Ciò significa che non possono essere utilizzati per limitare ulteriormente le eccezioni e le limitazioni al diritto d'autore previste dalla legge e non possono anche essere intesi come un mezzo per farlo. Tale pratica sarebbe inoltre contraria allo scopo delle licenze CC. Pertanto, nel contesto della più ampia disposizione che definisce la salvaguardia giuridica per TDM nell'UE, CC afferma molto chiaramente che i termini delle licenze CC non possono essere interpretati e funzionano come una riserva di diritti (opt-out) da parte dei titolari dei diritti rispetto a questa più ampia salvaguardia TDM.
Inoltre, in linea con il ragionamento di cui sopra, le licenze CC non possono essere utilizzate anche per ignorare alcune eccezioni e limitazioni al diritto d'autore. In particolare, la legge vieta qualsiasi preclusione contrattuale della salvaguardia legale fornita agli organismi di ricerca e agli istituti di tutela del patrimonio culturale per TDM. Quindi, se un uso rientra in questa salvaguardia, i termini delle licenze CC non si applicano.
Nell'UE, un output generato o supportato dall'IA può essere soggetto alla protezione del diritto d'autore?
La protezione del diritto d’autore, in quanto sistema incentrato sull’uomo, è concessa solo in presenza di un’originalità (umana), intesa come «espressione intellettuale propria dell’autore». Nulla esclude la possibilità che un output assistito dall'IA sia un'opera protetta dal diritto d'autore se l'autore umano è stato in grado di prendere decisioni creative, che possono essere rilevate nell'output, e quindi l'output è un'espressione originale dell'autore.
In generale, digitare un prompt non soddisferebbe i requisiti di cui sopra. Pertanto, si può dire che molti output assistiti o generati dall'IA non sono soggetti al diritto d'autore. Tuttavia, per ora esiste solo un dibattito dottrinale, ma nessuna giurisprudenza della Corte di giustizia dell'UE che esemplifica come misurare o identificare l'originalità e il coinvolgimento umano nelle produzioni generate o assistite dall'IA, o chi sarebbe esattamente proprietario del diritto d'autore su un'opera puramente generata dall'IA, se tali opere sono ritenute protette dal diritto d'autore.
Unisciti a noi nelle prossime sessioni
Ti è piaciuto questo post? Quindi unisciti ai nostri prossimi orari di Copyright e Policy Office! Puoi vedere una panoramica di tutte le prossime sessioni qui. Il prossimo evento del 19 luglio si concentrerà sull'accesso aperto, il diritto d'autore e l'etica con discussioni sull'intersezione tra la mancanza di limitazioni del diritto d'autore e il riutilizzo etico.
Se desideri continuare questa discussione, puoi farlo nella piattaforma inDICEs.
Disclaimer: Si prega di notare che né le discussioni fornite nel Copyright Office Hours né in questo post costituiscono una consulenza legale.
