En 2012, des recherches menées par Kennisland - notre partenaire de confiance depuis 2010 et les architectes de l'Europeana Licensing Framework - ont révélé que 54 % des 24 millions d'objets trouvés dans Europeana Collections ne disposaient d'aucune information normalisée sur les droits. Grâce à l’introduction d’un nouvel accord d’échange de données qui exige que tous les objets numériques soient étiquetés avec des déclarations de droits normalisées, ce pourcentage est tombé à 34 % au milieu de 2012.

Sur les 66 % restants, la recherche a estimé qu'environ la moitié étaient correctement étiquetés objets numériques, et environ la moitié étaient incorrects. Et pour y répondre, en 2013, nous avons lancé la campagne d'étiquetage des droits afin d'améliorer la présence et l'exactitude des déclarations. Nous nous sommes, plutôt naïvement, donné un délai de trois mois pour atteindre +/- 95% d'étiquetage et de précision.
C'est déjà beaucoup à prendre en compte. Mais c'était notre point de départ.
À l’horizon 2019, nous avons plus que doublé le nombre d’objets numériques, qui est passé de 24 à 58 millions.
Nous pouvons dire avec fierté que depuis juillet 2014, chaque objet publié par Europeana Collections est étiqueté avec une déclaration de droits. Et une étude publiée par Kennisland en 2018 a montré que 62% des objets étaient étiquetés par les partenaires de données avec une déclaration de droits précise. Des progrès significatifs ont donc été réalisés, mais nous avons eu le sentiment qu'il y avait beaucoup plus à faire.
En 2019, un troisième rapport de recherche de Kennisland a évalué l’exactitude des informations sur les droits dans les images de la plus haute qualité partagées par Europeana – celles remplissant les conditions requises pour le niveau 3 & 4 du cadre de publication. Cela montrait une image très différente: seulement 38 % des étiquettes étaient exactes. Le reste est une combinaison de facteurs mixtes, inexacts ou incapables de déterminer. Les principales causes étaient liées à l'utilisation abusive probable d'outils et de licences Creative Commons sous la forme de deux scénarios principaux: soit il est peu probable que le titulaire des droits ait donné son autorisation pour une licence particulière, soit il n’existe aucun droit d’auteur sur l’œuvre, de sorte qu’une licence ne peut être appliquée.
Un héritage de la campagne d'étiquetage des droits de 2013, qui a débuté la même année, a été l'intégration dans le processus d'ingestion des données des freins et contrepoids pour détecter et résoudre les problèmes les plus importants soulevés dans la recherche de 2012. Des questions telles que la revendication du droit d'auteur sur une œuvre du domaine public - allant à l'encontre des principes ancrés dans la charte du domaine public d'Europeana selon lesquels la numérisation ne devrait pas créer de nouveaux droits. Mais la recherche récente a mis en lumière un ensemble différent de problèmes, l'utilisation abusive - un terme sévère mais précis - des outils et des licences Creative Commons.
Nous avons donc vu de première main au cours de ces années que les institutions du patrimoine culturel ont du mal à appliquer des déclarations de droits précises à leurs objets numériques. Et que ce défi ne semble pas aller nulle part bientôt. Lors du Creative Commons Summit de cette semaine, Lisette Kalshoven – qui, dans ses précédents rôles chez Kennisland, a coécrit toutes les recherches sur l’exactitude des droits dans les données d’Europeana – abordera précisément cette question – Comment pouvons-nous obtenir des déclarations de droits plus précises de la part des GLAM? (Jetez un coup d'œil - le sommet est rempli de grandes sessions).
Nous pouvons également constater qu’il s’agit d’une conversation plus large qu’Europeana, nos partenaires de données et les membres de l’association du réseau. Pour nous, c’est une conversation familière, mais peut-être qu’elle est nouvelle pour vous; Jetons donc un coup d’œil à ce que nous avons appris en sept ans, à la manière dont nous mettons cette expérience en avant tout au long de 2019 et peut-être vous donnons-nous un aperçu des raisons pour lesquelles nous avons mis 18 mois à terminer cette toute première campagne en faveur des droits.
#1 La cohérence est notre meilleur ami
Mes collègues de l'équipe des services aux partenaires de données sont responsables de travailler avec vous, nos partenaires de données, pour examiner, affiner et publier leurs données. Leur rôle est également de soulever des questions de précision. Au fil des ans, la quantité de données qu'ils traitent et le nombre de partenaires de données ont considérablement augmenté, et les membres de l'équipe ont changé, mais les critères pour obtenir des informations précises sur les droits ont toujours été cohérents. Notre guide de publication - élaboré pour la première fois en 2014 - aligne nos pratiques de travail sur les normes, telles que les cadres de licences et de publication, que nous utilisons, établissant les critères d'acceptation des données.
En 2019, nous poursuivons nos conversations sur les droits, mais en mettant l'accent sur l'exactitude de l'utilisation des outils et des licences Creative Commons, afin de remédier aux inexactitudes découlant de leur utilisation abusive. Pour soutenir l'équipe des services aux partenaires de données, qui a reçu une formation sur le droit d'auteur de Kennisland plus tôt cette année, le guide de publication sera mis à jour pour définir plus clairement la façon dont nous abordons l'amélioration de la précision avec les outils et les licences Creative Commons.
#2 Nos priorités ne sont pas (souvent) vos priorités, nous devons réduire cet écart
Je pense que nous pouvons être d'accord, personne ne veut réellement que les informations sur les droits de leurs objets numériques & collections soient inexactes. Toutefois, nos ambitions au fil des ans pour y remédier n’ont pas toujours été alignées sur les priorités de nos partenaires en matière de données. Confrontés à un manque de ressources, de temps et souvent d'accès à l'expertise, nous avons appris à prévoir que nos partenaires de données auront besoin de (beaucoup) de temps pour répondre aux demandes de droits.
Ce que nous pensons être une simple question à résoudre prend souvent des mois à se frayer un chemin à travers les processus organisationnels. Mais il est important de bien faire les choses, de sorte qu’en 2019, nous allons explorer des moyens de mieux faire correspondre notre ambition de remédier aux inexactitudes dans les informations sur les droits avec vos priorités, par exemple en les alignant sur les mises à jour de vos ensembles de données. Nous avons également des incitations pour les partenaires qui souhaitent améliorer leurs informations sur les droits, car l'exactitude de la déclaration des droits devient un facteur pour déterminer où et comment nous pouvons partager vos données de haute qualité.

#3 Tu es génial, tu ne le sais tout simplement pas
Nous surestimons parfois, et parfois sous-estimons, ce que vous savez sur les droits d'auteur et les déclarations de droits. C’est un sujet difficile à maîtriser en profondeur, mais 99 % d’entre vous que je rencontre sous-estiment ce que vous savez et comprenez. Et bien que parler de droit d’auteur suscite parfois des gémissements de la part des personnes qui nous entourent, je suis toujours très impressionné par votre ouverture et votre empressement à en apprendre davantage sur ce sujet complexe (et, en fait, par le nombre d’entre vous qui souhaitent le faire).
En tant que défenseurs de meilleures règles en matière de droit d’auteur pour les institutions du patrimoine culturel, nous avons le privilège de travailler avec des experts dans le domaine du droit d’auteur. En 2019, nous continuerons à travailler avec des experts dans ce domaine, mais je souhaite également en savoir plus sur vous. J’ai lu et entendu beaucoup d’excellents exemples de flux de travail en matière de droits d’auteur et de déclarations de droits, de défis que vous avez surmontés et d’ateliers et de cours que vous avez organisés. Grâce à la communauté du droit d'auteur, vous avez la possibilité de partager cela avec un public captif et d'apprendre les uns des autres.
#4 Être transparent est vraiment difficile, nous devons faire mieux
Nous voulons vraiment vous dire comment vous allez. Au cours des années précédentes, nous avons expérimenté des tableaux de bord pour donner un contexte à vos collections parmi les ensembles de données plus larges disponibles via Europeana Collections. Mais l’automatisation de l’évaluation des informations sur les droits est loin d’être achevée. D’une part, nous ne disposons pas des données dont nous avons besoin – telles que des informations de date cohérentes pour chaque objet numérique – pour effectuer des calculs automatisés. Si vous prenez la calculatrice du domaine public - un processus de fabrication de décison si complexe qu'imprimé en très petits caractères, il remplit un mur du sol au plafond - vous verrez à quel point cette information est critique et à quel point elle serait utile (vous pouvez télécharger l'organigramme à la fin de cet article).
Mais au fur et à mesure que nous progresserons au cours de l’année à venir vers l’amélioration de l’exactitude des informations sur les droits, nous expérimenterons différentes façons de montrer les progrès globaux - jusqu’à quel point nous avons amélioré l’exactitude des déclarations de droits à partir de cette précision initiale de 38 % des données de la plus haute qualité. Et nous voulons partager plus d'exemples de la voie que nos partenaires ont empruntée pour améliorer la précision de leurs déclarations, afin que vous puissiez apprendre de nous et les uns des autres.
