Sinds januari 2015 is Europeana een van de digitalediensteninfrastructuren (DSI) van de Europese Unie. De EU heeft er verschillende, waaronder veiliger internet voor kinderen, elektronische gezondheidsdiensten en bedrijfsbeheer. Het Europeana DSI toont en biedt onlinetoegang tot het culturele en wetenschappelijke erfgoed van Europa via het platform Europeana Collections en ondersteunt instellingen voor cultureel erfgoed bij hun aanpassing aan dit digitale tijdperk.
Vorig jaar heeft de Europese Commissie een evaluatie van Europeana gepubliceerd, waarin onze resultaten en een aantal gebieden waarop we ons moeten concentreren, worden geschetst. In deze reeks zullen we enkele van de DSI-activiteiten van Europeana bekijken die in de evaluatie als een prioriteit werden beschouwd, zodat u een beter inzicht krijgt in de inspanningen en uitdagingen waaraan we momenteel werken.
De taal die u spreekt, mag geen belemmering vormen voor het vinden van wat u wilt in Europeana Collections, maar op dit moment is dat misschien wel het geval. Ontdek wat we doen om dat recht te zetten.
Europeana Collections bevat materiaal van galeries, bibliotheken, archieven en musea in alle 28 EU-lidstaten - en meer. U kunt op de website navigeren in 27 talen en gemakkelijk zoeken naar items die in uw eigen taal worden beschreven. Maar het wordt ingewikkelder als u items wilt zien die overeenkomen met uw zoekopdracht, maar in een andere taal worden beschreven.
In totaal worden 37 talen gebruikt om de collecties te beschrijven. Meer dan de helft van al het materiaal (57%) gebruikt echter een van de slechts vijf talen - Engels, Duits, Nederlands, Noors of Frans.
Het is niet eenvoudig om een in de ene taal beschreven item in de resultaten of bijbehorend materiaal te laten verschijnen wanneer er in een andere taal naar wordt gezocht. En we weten dat we nog een lange weg te gaan hebben, maar het doorvoeren van positieve veranderingen op dit gebied is een van onze prioriteiten.
Ons doel
We willen dat mensen vinden wat ze zoeken, zelfs als ze niet de taal gebruiken waarin hun doelitem wordt beschreven.
We willen de kans vergroten dat het zoeken naar iets in de ene taal resultaten oplevert die overeenkomen met uw criteria in een andere taal.
Uitdagingen
Automatische vertaling wordt steeds beter, maar het is niet onfeilbaar, zoals u zult hebben gezien als u ooit een online tool zoals Google Translate hebt gebruikt. In het geval van Europeana Collections zijn er extra complicaties. We concentreren ons niet op de vertaling van de ene specifieke taal in een andere. We werken met collecties die in 37 talen worden beschreven en proberen ze te koppelen aan zoektermen die in elke taal kunnen worden gebruikt. Bovendien lijken metadata niet op natuurlijke taal met volledige zinnen en voorspelbare grammatica; het wordt vaak gepresenteerd in korte zinnen of zelfs in enkele woorden, wat betekent dat de context die nodig is voor een nauwkeurige vertaling moeilijk te vinden is. Een andere laag van complexiteit is het feit dat de gebruikte termen zeer specifiek kunnen zijn - ze lijken misschien op een veel voorkomende term, maar hebben een andere betekenis wanneer ze worden gebruikt in de context van het beschrijven van digitaal cultureel materiaal.
Geautomatiseerde processen kunnen alleen werken als ze de juiste en juiste informatie krijgen. Dat klinkt voor de hand liggend, maar zoals we in de eerdere berichten in deze reeks hebben gezien, varieert de aan Europeana verstrekte informatie sterk qua diepgang en kwaliteit.
Om iets te kunnen vertalen, moeten we weten in welke taal het oorspronkelijke element is opgenomen. Onze systemen zullen niet raden. Elk element (zoals de titel en beschrijving) heeft dus een taalmarkering nodig. Dat is een andere informatielaag die instellingen voor cultureel erfgoed moeten verstrekken.
Wat we doen
Nieuwe innovaties
Dit jaar hebben we onze kwaliteitsnorm, het Europeana Publishing Framework, herzien om naast de bestaande normen voor inhoud ook normen voor metadata op te nemen. Nu moedigt het de mensen die aan metadata werken aan om elementen zoals titels in meerdere talen te vertalen en context-achtige plaatsnamen - die zelf meertalig zijn - uit contextuele woordenlijsten op te nemen (zie punt hieronder). Het kader moedigt ook het gebruik van die uiterst belangrijke taaltags aan om aan te geven welke taal wordt gebruikt. Dit neemt het giswerk weg en betekent dat er meer automatische koppelings- en vertaalprocessen kunnen worden geïmplementeerd.
Naast het gebruik van expertise van de Europeana Foundation en Network Association, vertrouwen we op het werk van anderen om de meertaligheid van Europeana Collections te verbeteren. In het afgelopen jaar hebben we een proefproject uitgevoerd met het eTranslation-team - een ander door de Europese Unie gefinancierd DSI-project. We bouwen nu voort op dat proefproject met verdere experimenten om het potentieel van het project voor automatische vertaling voor Europeana te benutten.
Lopende activiteiten
Wanneer een zin de juiste context krijgt, is het veel gemakkelijker om deze te vertalen. We blijven metagegevensverrijking gebruiken om meer context te bieden voor het materiaal dat u op Europeana Collections vindt. Onze inspanningen op dit gebied omvatten het gebruik van “contextuele woordenlijsten”, met name die welke beschikbaar zijn als gekoppelde open gegevens. Deze datasets geven ons extra details zoals meertalige labels, vertalingen van sleutelbegrippen of verschillende varianten van namen voor mensen en plaatsen. Dit maakt het gemakkelijker voor mensen om items op Europeana Collections te zoeken en te vinden. Woordenlijsten kunnen worden gebruikt door dataproviders of door Europeana als onderdeel van verschillende (semi-)automatische metadata-verrijkingsprocessen.
Europa is meertalig. Dat moeten wij ook zijn. We zijn onze partners en vrienden dankbaar dat ze ons hebben geholpen om belangrijke elementen zoals het Europeana-publicatiekader en de rechtenverklaringen die Europeana gebruikt (de informatie die u vertelt wat u kunt doen met een item dat u op Europeana vindt, bijvoorbeeld in het auteursrecht of in het publieke domein?) in meer talen te vertalen. Tot nu toe hebben de rechtenverklaringen zeven vertalingen en zijn er nog zes onderweg.
De website van Europeana Collections is beschikbaar in 27 talen en dit jaar hebben we een nieuwe tentoonstelling uitgebracht - Heritage at Risk - in zeven talen.
Waar moet je op letten...
Europeana meertalig maken is een prioriteit en het onderwerp van een tweedaags evenement in oktober onder het Finse voorzitterschap van de Raad van de EU. Tijdens het evenement zullen de Europeana Foundation en het Finse ministerie van Onderwijs en Cultuur zich richten op behoeften, verwachtingen en manieren om meertaligheid in digitaal cultureel erfgoed te bevorderen.
Jij kunt ook helpen. Samen met onze partners organiseren we “Transcribathon”-evenementen, waarbij iedereen wordt uitgenodigd om deel te nemen (online thuis of tijdens een fysiek evenement) en de inhoud van vaak handgeschreven tekstdocumenten wordt getypt, zodat deze gemakkelijker toegankelijk en doorzocht kunnen worden en machinaal kunnen worden vertaald. In het afgelopen jaar werden vijf transcribathons georganiseerd in samenwerking met erfgoedinstellingen in heel Europa (Duitsland, Italië, België, Oostenrijk, Roemenië) en werden bijna 3.000 documenten over de Eerste Wereldoorlog getranscribeerd.
Meer informatie
Lees meer over onze automatische verrijking of de eTranslation-activiteit van de Europese Unie.
En als u geïnteresseerd bent in de fijne details van het taalelement van het Europeana Publishing Framework, kunt u ook de Europeana Publishing Guide raadplegen, waarin precies wordt beschreven wat er nodig is bij het indienen van gegevens bij Europeana.
EuropeanaTech heeft inspanningen geleverd op het gebied van meertaligheid, zie bijvoorbeeld de beste praktijken voor meertalige toegang en de verschillende presentaties over het aanpakken van taalkwesties tijdens de laatste EuropeanaTech-conferentie.
En help Europeana meertaliger te maken door lid te worden van Transcribathon.eu. Daar vindt u tutorials om u te helpen aan de slag te gaan in het Engels, Frans en Duits, evenals informatie over onze volgende evenementen.
