En strategi for flersprogethed
I Europeana har vi i en årrække arbejdet på at muliggøre flersproget adgang til digital kulturarv, f.eks. ved at udnytte flersprogede sammenkædede åbne data til at berige metadata. Det har været en fælles indsats: Europeana Foundation spiller sin rolle, men dataleverandørernes arbejde er også afgørende. Dette kræver en passende langsigtet strategi og en gennemsigtig tilgang til deling af mål og igangværende bestræbelser.
I 2016 offentliggjorde EuropeanaTech en hvidbog om bedste praksis for flersproget adgang, som skitserede udfordringer på dette område og fremlagde idéer til at tackle dem. Under Europeana DSI-projektet i 2020 byggede vi videre på denne hvidbog for at offentliggøre en ny flersproget strategi og køreplan. Dette dokument indeholder forslag til håndtering af flersprogethed i forbindelse med tre generelle anvendelsesscenarier: Søg, naviger og læs. Den beskriver, hvordan Europeanas objektmetadata, fuldtekstindhold, redaktionelt indhold og brugergrænseflade kan beriges med flersprogede ressourcer og/eller oversættes automatisk for at give en bedre brugeroplevelse, og den foreslår en køreplan for eksperimenter og implementeringer.
Både hvidbogen fra 2016 og en tidlig version af denne strategi blev stillet til rådighed for feedback og delt med EuropeanaTech-fællesskabet. Strategien nød også godt af drøftelserne under et arrangement om flersprogethed i den digitale kulturarv, der blev afholdt af det finske EU-formandskab (se den fulde rapport her).
EuropeanaTech Indsigt og fremtidsplaner
I dag ønsker vi at gøre dig opmærksom på disse emner i forbindelse med et nyt nummer af EuropeanaTech Insight, der er dedikeret til flersprogethed i den digitale kulturarv. Dette nummer indeholder tre dokumenter, der præsenterer de problemer og nøgleteknologier, som Europeana og den bredere kulturarvssektor bør undersøge for bedre at forbinde samlinger og brugere på tværs af sprog. Dette omfatter de seneste fremskridt inden for automatisk oversættelsesteknologi, og hvordan denne teknologi kan bruges til søgning i kulturarvsregistre. Læs EuropeanaTech Insight.
I de kommende måneder vil vi fortsætte disse bestræbelser med fokus på at undersøge, hvordan Europeana kan anvende automatiske oversættelsessystemer som eTranslation, der drager fordel af de seneste fremskridt inden for AI-baseret sprogteknologi. Et projekt om automatisk oversættelse og Europeana er for nylig blevet udvalgt til medfinansiering i CEF Telecom Call on Automated Translation 2020, og vi holder dig opdateret via Europeana Pro-nyheder!
Bliv involveret
Ligesom alle systemer, der er baseret på maskinlæring, afhænger kvaliteten af den eTranslation-tjeneste, som Europa-Kommissionen leverer, af kvaliteten af de data, der bruges til at træne den. Jo flere kulturarvsdata, der stilles til rådighed for uddannelse, jo bedre vil det fungere for vores sektor, og derfor er datainput altid mere end velkomne. Vores tidligere indkaldelse af flersprogede data til eTranslation er fortsat åben, og vi opfordrer dig til at indsende forslag til den nyligt lancerede EuropeanaTech Challenge, som opfordrer til datasæt, der er egnede til brug i forskning og udvikling inden for kunstig intelligens/maskinlæring (som naturligvis omfatter en indsats inden for sprogteknologi).
Deltag i EuropeanaTech-fællesskabet for at udveksle idéer, modtage nyheder og netværk med eksperter om dette emne og forskning og udvikling i kulturarvssektoren.
