Les principes directeurs FAIR pour la gestion et l'intendance des données scientifiques visent à améliorer l'infrastructure et les services autour des données savantes. Ces principes, tels qu’ils sont présentés sur le site web GO FAIR qui les héberge, sont conçus comme des «lignes directrices visant à améliorer la facilité de recherche, l’accessibilité, l’interopérabilité et la réutilisation des actifs numériques». Ils orientent désormais la conception et la mise en œuvre d’initiatives majeures telles que le nuage européen pour la science ouverte (EOSC),comme l’illustre le projet FAIRsFAIR récemment lancé.
Europeana Collections et ses API rendent le patrimoine culturel numérisé de plus de 3 700 fournisseurs (galeries, bibliothèques, musées et archives) disponible dans toutes les langues européennes. Europeana Research souhaite que davantage de personnes utilisent ce matériel dans la recherche universitaire, en particulier dans les sciences humaines.
Nous explorons les possibilités d'assurer la liaison avec l'EOSC, qui répond également aux besoins de recherche en sciences humaines et sociales. Dans ce contexte, comment les services Europeana respectent-ils les principes FAIR et comment pouvons-nous jouer un rôle dans l’adoption plus large de ces principes dans le secteur du patrimoine culturel?
Comment les principes FAIR s'alignent-ils sur ceux d'Europeana?
Il y a beaucoup de résonance entre les principes FAIR et les valeurs et objectifs d’Europeana, tels qu’incarnés dans sa stratégie. Nos principes «utilisables, mutuels, fiables» et la manière dont nous les avons mis en œuvre au cours des dix dernières années s’alignent sur les principes «trouvables, accessibles, interopérables et réutilisables» de FAIR. Nous avons été impliqués dans le développement de technologies qui ont un grand potentiel pour améliorer la FAIRness des données, telles que les API web ouvertes, les données liées et le cadre international d'interopérabilité de l'image (IIIF), en les mettant en œuvre pour nous-mêmes et en encourageant tout le monde dans notre secteur à l'adopter.
Europeana et son vaste réseau de partenaires ont mis au point un cadre d'octroi de licences permettant des métadonnées entièrement ouvertes et l'étiquetage obligatoire du contenu avec des déclarations de droits normalisées et interopérables qui rendent claires les possibilités de réutilisation pour chaque élément. Nous avons également plaidé en faveur de l'adoption de meilleures politiques en matière de droit d'auteur qui facilitent le partage ouvert des données culturelles à tous les niveaux. Enfin, le vaste réseau de partenaires d’Europeana s’est efforcé d’améliorer la qualité des données fournies afin de rendre nos données très diverses plus utilisables dans tous les domaines et toutes les langues.
![[Ontwerp:] S[ocié]té A[nony]me de l'Exposition universelle et internationale de Gand 1913. Entrée principale. Coupe A-B](/files/Images/Blog_images/2019-04/Ghent.jpg)
[Ontwerp:] S[ocié]té A[nony]me de l'Exposition universelle et internationale de Gand 1913. Entrée principale. Coupe A-B,Oscar Henricus Van de Voorde, 1913, Bibliothèque de l’université de Gand, CC BY-SA

Comment les données et services d'Europeana répondent-ils aux exigences FAIR?
Europeana agrège les enregistrements de métadonnées sur les objets du patrimoine culturel. Ces registres fournissent des liens vers des contenus numérisés accessibles sur les sites web des partenaires d'Europeana et alimentent un service de recherche qui facilite la découverte de matériel culturel pour un large éventail de publics. Les données et les services sont présentés via une plate-forme Web et une série d'API. Il y a donc plusieurs niveaux à prendre en considération lors de l'évaluation de la FAIRness de l'offre d'Europeana.
F- À trouver
Le contenu numérisé auquel Europeana donne accès est décrit par des métadonnées, dont l'agrégation constitue l'épine dorsale des services d'Europeana. L’ampleur et la diversité des ensembles de métadonnées d’Europeana impliquent que leur richesse varie considérablement. Mais Europeana s’est dotée d’un modèle de données (voir ci-dessous) qui suit les principes de données liées qui donnent, outre la flexibilité, la possibilité à nos partenaires – ou Europeana elle-même – d’enrichir les métadonnées avec des liens vers des ressources sémantiques (multilingues) qui décrivent également le «contexte» des objets culturels, ce qui les rend plus faciles à trouver.
Comme mentionné précédemment, nous indexons l'ensemble de données Europeana et le rendons consultable en ligne nous-mêmes. En outre, l’ensemble de données peut être trouvé par l’intermédiaire des infrastructures de recherche européennes CLARIN et EUDAT.
Europeana et ses partenaires promeuvent l’identification persistante des métadonnées et des versions numériques des objets du patrimoine culturel. Europeana attribue des identifiants à chaque enregistrement agrégé et a mis en place des procédures pour soutenir la persistance de ses identifiants dans la mesure du possible. Les identifiants Europeana sont des URI et sont inclus dans les enregistrements de données dans tous les formats dans lesquels l’ensemble de données est disponible. Dans un contexte d'agrégation où les données sont transmises et traitées entre différents partenaires, nous ne pouvons pas (et pour les préoccupations de provenance ne veulent pas) imposer l'unicité globale, c'est-à-dire qu'il peut y avoir plusieurs identifiants pour plusieurs versions d'une ressource. Mais nous essayons de maintenir des liens entre toutes ces versions afin que les consommateurs de nos services puissent toujours trouver ce qu'ils recherchent.
A - Être accessible
Les identifiants Europeana sont des URI solubles (HTTP), qui orientent les utilisateurs et les services consommateurs de données vers les pages de notre site Web ou les données de nos API. Europeana tente également de résoudre les URI obsolètes et mis à jour pour des raisons techniques, en utilisant la redirection HTTP.
L’ensemble de données d’Europeana est accessible par l’intermédiaire d’API web qui mettent en œuvre des protocoles ouverts et standardisés, tels que les protocoles et pratiques relatifs aux données liées (y compris SPARQL), OpenSearch, OAI-PMH.
L’accès aux enregistrements de l’ensemble de données via leurs URI est gratuit et aucune authentification n’est requise. Certaines API (telles que l’API Annotations)et certaines parties de notre plateforme (comme Europeana 1914-1918)nécessitent une authentification, car elles permettent la modification de nos données.
I - Être interopérable
Europeana utilise le modèle de données Europeana (EDM) pour l'échange de données avec les fournisseurs de données, pour son système d'information interne, ainsi que pour une utilisation par des tiers. EDM est un modèle collaboratif, basé sur la communauté, développé en consultation avec des représentants de tous les domaines représentés dans Europeana. Il fait l'objet d'une amélioration continue. EDM est basé sur le Resource Description Framework (RDF), qui nous permet de créer un modèle pour nos métadonnées qui réutilise principalement les vocabulaires standard existants (données liées), tels que Dublin Core, SKOS et FOAF.
Europeana aide ses partenaires de données à utiliser des vocabulaires pour faire référence à des concepts, des lieux, des personnes et des organisations. Les vocabulaires les plus utilisés dans l’ensemble de données sont DBpedia et Geonames. Notre utilisation de vocabulaires externes pour l’enrichissement suit toujours les pratiques standard des données ouvertes liées et des préoccupations telles que la qualité et l’accès.
Notez que dans quelques cas qui sont cruciaux pour Europeana, nous nous sommes lancés dans la création de nos propres vocabulaires, comme celui de RightsStatements.org (voir ci-dessous) pour compléter les normes existantes. Encore une fois, cela est axé sur la communauté et suit les meilleures pratiques existantes (telles que la fourniture d'URI).
R - Pour être réutilisable
Faciliter la réutilisation des données relatives au patrimoine culturel est un objectif clé d'Europeana.
Toutes les métadonnées fournies à Europeana doivent faire l’objet d’une licence CC0, et Europeana rend l’ensemble complet de métadonnées agrégées (y compris les résultats de ses propres améliorations en matière de données) ouvertement disponible sous CC0 également.
Les droits d’utilisation du contenu sont énoncés dans chaque enregistrement, en utilisant les déclarations de droits de Creative Commons ou de RightsStatements.org, ce dernier étant un vocabulaire développé en tant qu’initiative communautaire visant à améliorer la communication sur le droit d’auteur et le statut de réutilisation des objets numériques par les institutions du patrimoine culturel, ce qui permet aux utilisateurs de «voir plus facilement si et comment les œuvres du patrimoine culturel en ligne peuvent être réutilisées».
La provenance des données est toujours indiquée, en reconnaissant le fournisseur de données d’origine (par exemple, un musée ou une bibliothèque) et tous les intermédiaires du flux de travail d’agrégation dans les métadonnées.
Enfin, nos métadonnées sont rendues disponibles grâce à l’utilisation de normes de données couramment utilisées dans les domaines du patrimoine culturel, de l’éducation et de la recherche, telles que Schema.org, Dublin Core, SKOS et autres (grâce en partie au fait que l’EDM suit les meilleures pratiques en matière de modélisation des données et se fonde déjà sur ces normes).
Que fera Europeana dans un avenir proche?
Afin d’encourager davantage les partenaires à fournir des données plus riches qui rendent le patrimoine culturel numérique plus facile à trouver et plus réutilisable, Europeana déploie des efforts continus en matière de qualité des données pour partager les meilleures pratiques et rendre compte de la qualité des contenus et des métadonnées d’une manière utile et motivante tant pour les fournisseurs que pour les utilisateurs.
Nous avons récemment défini des mesures pour la qualité des métadonnées, en identifiant les éléments de données clés et les valeurs qui permettent des interfaces utilisateur riches et une meilleure expérience utilisateur. Dans les prochains mois, nous allons rendre ces mesures accessibles à nos réutiliseurs de données afin qu'ils puissent identifier le matériau qui leur est le plus utile.
En ce qui concerne l'accessibilité des contenus numérisés, Europeana est membre fondateur du nouveau cadre international d'interopérabilité de l'image (IIIF). IIIF est un ensemble d'API ouvertes conçues pour aider les utilisateurs à publier du contenu numérique sur le Web d'une manière plus interopérable, permettant une interaction plus riche avec le contenu dans tous les référentiels et permettant de mieux suivre la provenance du contenu. Europeana reconnaît et exploite le contenu IIIF qui nous est fourni et travaille dur pour encourager nos partenaires de données à l'adopter.
Parmi les autres évolutions pertinentes pour les mesures FAIR figurent la mise en œuvre prochaine d’un mécanisme d’autorisation d’authentification unique pour tous nos produits et les efforts continus visant à adapter notre modèle de données aux nouveaux besoins en matière d’applications et de partage de données, d’une manière axée sur la communauté (un exemple récent étant une extension pour représenter et publier le contenu en texte intégral des journaux).
Restez informé et rejoignez-nous
Pour rester informé des développements tels que ceux décrits dans cet article, rejoignez les communautés Europeana Research et/ou EuropeanaTech de l’association Europeana Network et suivez-nous sur Twitter (@eurresearch et @europeanatech)
Cet article a été édité le 01/02/2022 afin de clarifier la manière dont Europeana attribue les identifiants aux enregistrements.
