Een strategie voor meertaligheid
Bij Europeana werken we al een aantal jaren om meertalige toegang tot digitaal cultureel erfgoed mogelijk te maken, bijvoorbeeld door meertalige gekoppelde open data te benutten om metadata te verrijken. Het was een maatschappelijke inspanning: Europeana Foundation speelt een rol, maar het werk van dataproviders is ook cruciaal. Dit vereist een passende langetermijnstrategie en een transparante aanpak van het delen van doelstellingen en lopende inspanningen.
In 2016 publiceerde EuropeanaTech een whitepaper over beste praktijken voor meertalige toegang, waarin uitdagingen op dit gebied werden geschetst en ideeën werden gepresenteerd om deze aan te pakken. In het kader van het Europeana DSI-project in 2020 hebben we op deze whitepaper voortgebouwd om een nieuwe meertalige strategie en routekaart te publiceren. Dit document bevat voorstellen voor de aanpak van meertaligheid in de context van drie algemene gebruiksscenario's: zoeken, navigeren en lezen. Hierin wordt uiteengezet hoe de objectmetagegevens, de volledige tekst, de redactionele inhoud en de gebruikersinterface van Europeana kunnen worden verrijkt met meertalige bronnen en/of automatisch kunnen worden vertaald om een betere gebruikerservaring te bieden, en wordt een routekaart met experimenten en implementaties voorgesteld.
Zowel de whitepaper van 2016 als een vroege versie van deze strategie werden beschikbaar gesteld voor feedback en gedeeld met de EuropeanaTech-gemeenschap. De strategie heeft ook geprofiteerd van de besprekingen tijdens een door het Finse voorzitterschap van de EU georganiseerd evenement over meertaligheid in digitaal cultureel erfgoed (zie het volledige verslag hier).
EuropeanaTech Insight en toekomstplannen
Vandaag willen we deze onderwerpen onder uw aandacht brengen in het kader van een nieuw nummer van EuropeanaTech Insight, gewijd aan meertaligheid in digitaal cultureel erfgoed. Dit nummer bevat drie papers waarin de problemen en belangrijke technologieën worden gepresenteerd die Europeana en de bredere culturele erfgoedsector zouden moeten onderzoeken om collecties en gebruikers in verschillende talen beter met elkaar te verbinden. Dit omvat de recente vooruitgang op het gebied van automatische vertaaltechnologie en de manier waarop deze technologie kan worden gebruikt voor het zoeken in bewaarplaatsen voor cultureel erfgoed. Lees EuropeanaTech Insight.
In de komende maanden zullen we deze inspanningen voortzetten en onderzoeken hoe Europeana gebruik kan maken van automatische vertaalsystemen zoals eTranslation, die profiteren van de recente vooruitgang op het gebied van door AI aangedreven taaltechnologie. Een project over automatische vertaling en Europeana is onlangs geselecteerd voor medefinanciering in de 2020 CEF Telecom Call on Automated Translation, en we zullen u op de hoogte houden via Europeana Pro nieuws!
Doe mee
Zoals alle systemen die gebaseerd zijn op machinaal leren, hangt de kwaliteit van de eTranslation-dienst van de Europese Commissie af van de kwaliteit van de gegevens die worden gebruikt om deze dienst op te leiden. Hoe meer gegevens over cultureel erfgoed beschikbaar worden gesteld voor de opleiding, hoe beter het zal werken voor onze sector, daarom is gegevensinvoer altijd meer dan welkom. Onze eerdere oproep tot het indienen van meertalige gegevens voor eTranslation blijft openstaan en wij nodigen u uit voorstellen in te dienen voor de onlangs gelanceerde EuropeanaTech Challenge, waarin wordt opgeroepen tot datasets die geschikt zijn voor gebruik in onderzoek en ontwikkeling op het gebied van artificiële intelligentie/machine learning (die uiteraard ook inspanningen op het gebied van taaltechnologie omvatten).
Word lid van de EuropeanaTech-gemeenschap om ideeën uit te wisselen, nieuws te ontvangen en te netwerken met deskundigen op dit gebied en onderzoek en ontwikkeling in de sector cultureel erfgoed.
