Les développements en intelligence artificielle (IA) présentent une foule d'opportunités passionnantes pour les GLAM (galeries, bibliothèques, archives et musées) dans le monde numérique. Celles-ci vont du développement de modèles ou d'algorithmes perfectionnés grâce au traitement des données, à l'exploration, l'analyse et l'enrichissement d'ensembles de données avec de nouvelles métadonnées. Si ces possibilités sont susceptibles de propulser les GLAM dans leur transformation numérique, elles soulèvent également des questions dans le domaine du droit d’auteur, en particulier lorsqu’il s’agit d’utiliser les collections numériques des GLAM pour former l’IA et le traitement des sorties générées par l’IA en vertu du droit d’auteur.
Chez Creative Commons (CC), nous réfléchissons actuellement à certaines questions et dans cet article, nous partageons notre point de vue sur trois points clés: l’utilisation des collections par les GLAM pour la formation à l’IA; le statut en matière de droit d’auteur/domaine public des contenus générés par l’IA; et les obstacles au-delà du droit d’auteur à l’ouverture et au partage des collections GLAM à la lumière du manque de clarté entourant l’IA.
Utilisation des collections GLAM en tant qu’entrée pour la formation à l’IA
CC soutient pleinement les GLAM dans l’utilisation des quantités massives de données dans leurs collections numériques à des fins de formation à l’IA (y compris l’apprentissage automatique) afin de remplir leurs missions d’intérêt public. Sur le plan juridique, il subsiste une grande incertitude quant à savoir si les limitations et exceptions au droit d’auteur permettent l’utilisation de contenus protégés par le droit d’auteur pour la formation à l’IA. Cette incertitude est susceptible d’avoir un effet dissuasif sur les GLAM souhaitant tirer parti des technologies de l’IA. C'est l'une des raisons pour lesquelles, au CC, nous soutenons que l'utilisation d'œuvres protégées par le droit d'auteur pour former l'IA devrait être considérée comme non contrefaisante par défaut. En ce qui concerne le contenu sous licence CC, lorsque l’autorisation du droit d’auteur est requise pour former des systèmes d’IA, les licences accordent cette autorisation selon des modalités et conditions différentes en fonction de la licence CC particulière. Un organigramme permet de visualiser si les licences sont déclenchées et si oui, quelles conditions peuvent s'appliquer.
Pas de droit d'auteur sur le contenu «créatif» de l'IA
Il a été constaté que l’IA générait du contenu «créatif» grâce à des processus tels que les chaînes Markov et les réseaux de neurones artificiels tels que GPT-3 (Generative Pre-trained Transformer 3, un modèle d’apprentissage profond capable de produire du texte). Ce contenu pourrait très bien faire partie des collections des GLAM, car il commence à être apprécié comme une nouvelle forme d’expression «créative». De même, le contenu généré par les GLAM utilisant la technologie de l'IA (comme les ensembles de données enrichis) est susceptible de devenir abondant à mesure que de plus en plus d'institutions explorent les opportunités offertes par l'IA.
Bien que le statut en matière de droit d’auteur de ces contenus ne soit pas clair en vertu de la législation existante, CC est fermement d’avis qu’il ne devrait pas y avoir de droit d’auteur sur les contenus générés par l’IA et qu’ils devraient relever du domaine public. Le matériel du domaine public peut être largement consulté, utilisé et réutilisé par les GLAM dans l'accomplissement de leur mission d'intérêt public ainsi que par le grand public. Nous avons récemment déclaré que nous en bénéficions tous lorsque les connaissances, la culture et l'histoire sont rendues accessibles et partageables. C’est pourquoi, conformément aux principes proclamés dans la charte du domaine public d’Europeana, nous devons continuer à plaider en faveur d’un accès ouvert à la connaissance et à la culture et à résister à d’autres clôtures de notre domaine public commun.
Obstacles au-delà du droit d'auteur
Au-delà du droit d’auteur, plusieurs obstacles au partage et à l’utilisation des collections GLAM liés à l’éthique, à la vie privée et à la protection des données doivent être évalués afin de clarifier le rôle en évolution rapide que l’IA joue dans le secteur GLAM. Si vous souhaitez participer à la conversation sur l’IA et le contenu sous licence ouverte avec des experts en politiques du monde entier, devenez membre de la plateforme CC Copyright en rejoignant notre liste de diffusion CC Policy.
Pour en savoir plus sur l’IA et le patrimoine culturel, explorez l’accent que nous mettons sur l’IA dans Europeana Pro. Si vous souhaitez en savoir plus sur les sujets abordés dans cet article et travailler avec vos pairs à travers l'Europe, en savoir plus sur l'adhésion aux communautés EuropeanaTech et Copyright.
