Le projet Europeana Common Culture vise à mettre en place un environnement harmonisé et coordonné pour les agrégateurs nationaux d’Europeana, ainsi qu’à améliorer la qualité du contenu et des métadonnées afin d’accroître la satisfaction des utilisateurs. Dans le cadre du projet, trois pilotes (Metis Sandbox, Linked Open Data Aggregator et 3D Content in Europeana) ont expérimenté de nouvelles approches d'agrégation qui ont été testées par des agrégateurs nationaux (AN) et validées auprès d'institutions du patrimoine culturel (ICC). Le projet pilote Metis Sandbox a été mené par Deutsche Digitale Bibliothek (DDB) et livré en étroite collaboration avec la Fondation Europeana.
En tant qu'agrégateur de longue date pour Europeana, la DDB avait des observations pratiques et de l'expérience à apporter au pilote. Le processus de publication des données DDB dans Europeana a souvent pris beaucoup de temps (parfois jusqu'à six mois), pour diverses raisons: les données n’étaient pas valides selon le modèle de données Europeana (EDM) et devaient être corrigées par la DDB ou par l’institution du patrimoine culturel/le fournisseur intermédiaire; ou il a été constaté que la qualité des données était médiocre et que des corrections de données ou de cartographie étaient nécessaires. Tout cela s’accompagnait d’une communication aller-retour entre l’équipe des services de publication de données (DPS) d’Europeana, l’agrégateur, parfois un agrégateur intermédiaire, et le CHI. Cette boucle a dû être répétée plusieurs fois jusqu'à ce que tout soit correct, ce qui a pris beaucoup de temps.
Cela a conduit à la question suivante: et si les agrégateurs pouvaient voir à quoi ressemblaient les données dans Europeana sans impliquer l’équipe DPS? Ils seraient en mesure d’effectuer des corrections avant même d’envoyer les données à Europeana. Il aurait le potentiel de profiter à tous les agrégateurs en réduisant le nombre d'étapes nécessaires pour publier des données via Europeana, ainsi que la communication aller-retour!
C'est ainsi que le Metis Sandbox est né.
Aspects techniques
Le Metis Sandbox permet le traitement d'échantillons de données en fonction du flux de travail Metis. De l’importation, de la validation, de la transformation, de la normalisation et de l’enrichissement des données à la publication, il reproduit étape par étape les processus appliqués au sein de Metis, l’infrastructure de base d’Europeana pour l’agrégation des données. Le système émet des rapports pour chaque étape si une erreur est signalée et fournit un lien vers un environnement de prévisualisation à la fin du processus, permettant à l'utilisateur de voir ses données dans une copie d'Europeana. Les données produites par le système contiennent tous les enrichissements automatiques et les métadonnées techniques générés par Europeana, ainsi que les niveaux de qualité du contenu et des métadonnées.
Le DDB a été le premier à tester le pilote. Et oh quelle joie c'était! Il n’est pas fréquent que les mots «données» et «joie» se trouvent dans le même contexte, mais le fait de pouvoir voir les données ainsi que le niveau de contenu et de métadonnées signifiait que c’était le cas. À partir du moment où il a été testé, le Metis Sandbox a eu une incidence directe sur l’amélioration du flux de données de la DDB et sur la qualité des données soumises.
Il était alors temps d'impliquer d'autres agrégateurs du projet Europeana Common Culture et d'obtenir plus de commentaires sur le Metis Sandbox. Plusieurs agrégateurs nationaux participant au projet ont participé aux essais et à l'évaluation et les résultats ont été très encourageants: 83% des participants l'ont trouvé utile et ont indiqué qu'ils seraient heureux d'utiliser Metis Sandbox pour les livraisons futures à Europeana. Les caractéristiques les plus appréciées de l'outil étaient le calcul du niveau de contenu et de métadonnées, la validation des données et le rapport détaillé d'erreur/d'avertissement.
Alors, qu'y a-t-il dans les livres pour l'avenir de Metis Sandbox?
Développement futur
Le bac à sable métis est, à côté des Métis, l’un des piliers de la stratégie d’agrégation d’Europeana publiée en octobre. En s'appuyant sur le projet pilote développé au cours du projet, la Fondation Europeana l'étendra encore pour fournir, avec Metis, une solution qui offre des moyens d'accélérer le processus de publication dans Europeana, de soutenir la transformation numérique des agrégateurs et des institutions du patrimoine culturel et d'améliorer la qualité des données. La version publique de Metis Sandbox sera disponible au printemps 2021.
En savoir plus sur le partage de données avec Europeana et lire notre stratégie d’agrégation.
