Depuis janvier 2015, Europeana est l’une des infrastructures de services numériques (ISN) de l’Union européenne. L'UE en a plusieurs, d'autres comprennent un internet plus sûr pour les enfants, des services de santé électroniques et la gestion des entreprises. Europeana DSI présente et fournit un accès en ligne au patrimoine culturel et scientifique de l’Europe par l’intermédiaire de la plateforme Europeana Collections et soutient les institutions du patrimoine culturel dans leur adaptation à cette ère numérique.
L’année dernière, la Commission européenne a publié une évaluation d’Europeana, qui décrivait nos réalisations et certains domaines sur lesquels nous devrions nous concentrer l’année prochaine. Dans cette série, nous examinerons certaines des activités d’Europeana DSI que l’évaluation a considérées comme prioritaires, ce qui vous permettra de mieux comprendre les efforts et les défis sur lesquels nous travaillons actuellement.
La langue que vous parlez ne devrait pas être un obstacle à la recherche de ce que vous voulez sur Europeana Collections, mais elle pourrait l’être à l’heure actuelle. Découvrez ce que nous faisons pour remédier à cette situation.
Europeana Collections contient du matériel provenant de galeries, de bibliothèques, d'archives et de musées des 28 pays membres de l'UE - et plus encore. Vous pouvez naviguer sur le site web en 27 langues et il est facile de rechercher les éléments décrits dans votre propre langue. Mais les choses deviennent plus compliquées lorsque vous voulez voir des éléments qui correspondent à votre recherche, mais qui sont décrits dans une langue différente.
Au total, 37 langues sont utilisées pour décrire les collections. Cependant, plus de la moitié du matériel (57%) utilise l'une des cinq langues - l'anglais, l'allemand, le néerlandais, le norvégien ou le français.
Faire apparaître un élément décrit dans une langue dans les résultats ou le matériel connexe lorsqu'il est recherché dans une autre langue n'est pas facile. Et nous savons que nous avons encore beaucoup de chemin à parcourir, mais apporter des changements positifs dans ce domaine est l'une de nos priorités.
Notre objectif
Nous voulons que les gens trouvent ce qu’ils recherchent, même s’ils n’utilisent pas la langue dans laquelle leur article cible est décrit.
Nous voulons augmenter les chances que la recherche de quelque chose dans une langue apporte des résultats qui correspondent à vos critères dans une autre langue.
Défis
La traduction automatique s’améliore, mais elle n’est pas infaillible, comme vous l’aurez vu si vous avez déjà utilisé un outil en ligne tel que Google Translate. Dans le cas d'Europeana Collections, il y a des complications supplémentaires. Nous ne nous concentrons pas sur la traduction d’une langue spécifique dans une autre. Nous travaillons avec des collections décrites dans 37 langues et essayons de les faire correspondre à des termes de recherche qui pourraient être disponibles dans n’importe quelle langue. Qui plus est, les métadonnées ne ressemblent pas au langage naturel avec des phrases complètes et une grammaire prévisible; il est souvent présenté en phrases courtes ou même en mots simples, ce qui signifie que le contexte requis pour une traduction précise est difficile à trouver. Ajoutant une autre couche de complexité est le fait que les termes utilisés peuvent être très spécifiques - ils peuvent ressembler à un terme commun, mais ont une signification différente lorsqu'ils sont utilisés dans le contexte de la description du matériel culturel numérique.
Les processus automatisés ne peuvent fonctionner que lorsqu'ils reçoivent les informations correctes et appropriées. Cela semble évident, mais comme nous l’avons vu dans les articles précédents de cette série, les informations fournies à Europeana varient considérablement en termes de profondeur et de qualité.
Pour que quoi que ce soit soit soit traduit, nous devons savoir dans quelle langue l'élément original est fourni. Nos systèmes ne devineront pas. Ainsi, chaque élément (comme le titre et la description) a besoin d'un marqueur de langue. Il s’agit d’une autre couche d’informations que les institutions du patrimoine culturel doivent fournir.
Ce que nous faisons
Nouvelles innovations
Cette année, nous avons révisé notre norme de qualité, Europeana Publishing Framework, afin d'inclure des normes pour les métadonnées en plus des normes existantes pour le contenu. Maintenant, il encourage les personnes qui travaillent sur les métadonnées à traduire des éléments tels que des titres dans plusieurs langues et à inclure des noms de lieux contextuels - qui sont eux-mêmes multilingues - à partir de vocabulaires contextuels (voir l'élément ci-dessous). Le cadre encourage également l'utilisation de ces balises de langue très importantes pour montrer quelle langue est utilisée. Cela élimine les conjectures et signifie que des processus de liaison et de traduction plus automatiques peuvent être mis en œuvre.
En plus d'utiliser l'expertise de la Fondation Europeana et de l'Association Network, nous nous appuyons sur le travail d'autres personnes pour améliorer le multilinguisme des collections Europeana. Au cours de l'année écoulée, nous avons mené un projet pilote avec l'équipe eTranslation - un autre projet DSI financé par l'Union européenne. Nous nous appuyons maintenant sur ce projet pilote pour mener d’autres activités d’expérimentation en vue de tirer parti du potentiel de traduction automatique du projet pour Europeana.
Activités en cours
Lorsqu’une phrase est mise dans le bon contexte, il est beaucoup plus facile de la traduire. Nous continuons d'utiliser l'enrichissement des métadonnées pour fournir plus de contexte pour le matériel que vous trouvez sur Europeana Collections. Nos efforts dans ce domaine comprennent l’utilisation de «vocabulaires contextuels», en particulier ceux disponibles sous la forme de données ouvertes liées. Ces ensembles de données nous donnent des détails supplémentaires tels que des étiquettes multilingues, des traductions de concepts clés ou différentes variantes de noms pour les personnes et les lieux. Cela facilite la recherche et la recherche d'articles sur Europeana Collections. Les vocabulaires peuvent être utilisés soit par les fournisseurs de données, soit par Europeana dans le cadre de divers processus (semi-)automatiques d’enrichissement des métadonnées.
L'Europe est multilingue. Nous devons l'être aussi. Nous remercions nos partenaires et amis de nous avoir aidés à traduire des éléments importants tels que le cadre d’édition d’Europeana et les déclarations de droits utilisées par Europeana (les informations qui vous indiquent ce que vous pouvez faire avec un élément que vous trouvez sur Europeana, par exemple dans le domaine du droit d’auteur ou dans le domaine public?) dans d’autres langues. Jusqu'à présent, les déclarations de droits ont sept traductions et six autres sont en route.
Le site Europeana Collections est disponible en 27 langues, et cette année, nous avons publié une nouvelle exposition - Heritage at Risk - en sept langues.
Ce qu'il faut surveiller...
Rendre Europeana plus multilingue est une priorité et fait l’objet d’une manifestation de deux jours en octobre, sous la présidence finlandaise du Conseil de l’UE. L'événement verra la Fondation Europeana et le ministère finlandais de l'Éducation et de la Culture se concentrer sur les besoins, les attentes et les voies à suivre pour le multilinguisme dans le patrimoine culturel numérique.
Vous pouvez aider aussi. Avec nos partenaires, nous organisons des événements «Transcribathon» qui invitent toute personne à participer (soit à la maison en ligne, soit lors d’un événement physique) et à taper le contenu de documents textuels souvent écrits à la main afin qu’ils puissent ensuite être plus facilement consultés et recherchés, et qu’ils puissent être traduits en machine. Au cours de l'année écoulée, cinq transcribathons ont été organisés en coopération avec des institutions du patrimoine dans toute l'Europe (Allemagne, Italie, Belgique, Autriche, Roumanie) et près de 3 000 documents liés à la Première Guerre mondiale ont été transcrits.
En savoir plus
En savoir plus sur nos enrichissements automatiques ou sur l’activité eTranslation de l’Union européenne.
Et si vous êtes intéressé par les détails détaillés de l’élément linguistique du cadre de publication d’Europeana, vous pouvez également consulter le guide de publication d’Europeana, qui détaille exactement ce qui est requis lors de la soumission de données à Europeana.
EuropeanaTech a déployé des efforts dans le domaine du multilinguisme, voir par exemple les bonnes pratiques en matière d’accès multilingue et les différentes présentations sur le traitement des questions linguistiques lors de la dernière conférence EuropeanaTech.
Et contribuez à rendre Europeana plus multilingue en vous inscrivant sur Transcribathon.eu. Vous y trouverez des tutoriels pour vous aider à démarrer en anglais, français et allemand, ainsi que des informations sur nos prochains événements.
