Une stratégie pour le multilinguisme
Chez Europeana, nous travaillons depuis plusieurs années pour permettre un accès multilingue au patrimoine culturel numérique, par exemple en exploitant des données ouvertes multilingues liées pour enrichir les métadonnées. Il s'agit d'un effort communautaire: La Fondation Europeana joue son rôle, mais le travail des fournisseurs de données est également crucial. Cela nécessite une stratégie appropriée à long terme et une approche transparente du partage des objectifs et des efforts continus.
En 2016, EuropeanaTech a publié un livre blanc sur les meilleures pratiques en matière d’accès multilingue, qui décrivait les défis dans ce domaine et présentait des idées pour y faire face. Dans le cadre du projet Europeana DSI en 2020, nous nous sommes appuyés sur ce livre blanc pour publier une nouvelle stratégie et une nouvelle feuille de route multilingues. Ce document présente des propositions pour gérer le multilinguisme dans le cadre de trois scénarios d'utilisation généraux: rechercher, naviguer et lire. Il présente comment les métadonnées des objets, le contenu en texte intégral, le contenu éditorial et l'interface utilisateur d'Europeana peuvent être enrichis de ressources multilingues et/ou traduits automatiquement afin d'offrir une meilleure expérience utilisateur, et il propose une feuille de route d'expérimentations et de mises en œuvre.
Le livre blanc de 2016 et une première version de cette stratégie ont été mis à disposition pour commentaires et partagés avec la communauté EuropeanaTech. La stratégie a également bénéficié des discussions menées lors d’une manifestation sur le multilinguisme dans le patrimoine culturel numérique organisée par la présidence finlandaise de l’UE (voir le rapport complet ici).
EuropeanaTech Insight et plans pour l'avenir
Aujourd'hui, nous voulons porter ces sujets à votre attention dans le contexte d'un nouveau numéro d'EuropeanaTech Insight consacré au multilinguisme dans le patrimoine culturel numérique. Ce numéro contient trois articles qui présentent les problèmes et les technologies clés qu'Europeana et le secteur du patrimoine culturel au sens large devraient étudier afin de mieux connecter les collections et les utilisateurs entre les langues. Il s'agit notamment des progrès récents en matière de technologie de traduction automatique et de la manière dont cette technologie peut être utilisée pour la recherche dans les dépôts du patrimoine culturel. Lire EuropeanaTech Insight.
Au cours des prochains mois, nous poursuivrons ces efforts, en nous concentrant sur la manière dont Europeana peut utiliser des systèmes de traduction automatique tels que eTranslation, qui bénéficient des progrès récents de la technologie linguistique fondée sur l’IA. Un projet sur la traduction automatique et Europeana a récemment été sélectionné pour un cofinancement dans le cadre de l’appel de télécoms 2020 du MIE sur la traduction automatisée, et nous vous tiendrons au courant des actualités d’Europeana Pro!
Impliquez-vous
Comme tous les systèmes basés sur l'apprentissage automatique, la qualité du service eTranslation fourni par la Commission européenne dépend de la qualité des données utilisées pour le former. Plus les données sur le patrimoine culturel sont mises à disposition pour sa formation, mieux cela fonctionnera pour notre secteur, donc la saisie de données est toujours plus que bienvenue. Notre précédent appel à données multilingues pour eTranslation reste ouvert, et nous vous invitons à soumettre des propositions pour le récent EuropeanaTech Challenge, qui appelle à des ensembles de données appropriés pour une utilisation dans la recherche et le développement en matière d’intelligence artificielle et d’apprentissage automatique (qui incluent naturellement des efforts dans le domaine des technologies linguistiques).
Pour échanger des idées, recevoir des nouvelles et réseauter avec des experts sur ce sujet et sur la recherche et le développement dans le secteur du patrimoine culturel, rejoignez la communauté EuropeanaTech.
