Sedan januari 2015 är Europeana en av EU:s infrastrukturer för digitala tjänster. EU har flera av dem, bland annat säkrare internet för barn, elektroniska hälso- och sjukvårdstjänster och företagsledning. Europeana DSI visar upp och ger onlinetillgång till Europas kulturella och vetenskapliga arv genom plattformen Europeana Collections och stöder kulturarvsinstitutioner när de anpassar sig till denna digitala tidsålder.
Förra året offentliggjorde Europeiska kommissionen en utvärdering av Europeana, där vi beskrev våra resultat och några områden att fokusera på härnäst. I den här serien kommer vi att titta på några av Europeanas DSI-aktiviteter som utvärderingen ansåg vara en prioritering, vilket ger dig en större förståelse för de ansträngningar och utmaningar vi arbetar med just nu.
Det språk du talar bör inte vara ett hinder för att hitta det du vill ha på Europeana Collections, men just nu kan det vara det. Ta reda på vad vi gör för att rätta till det.
Europeana Collections innehåller material från gallerier, bibliotek, arkiv och museer i alla 28 EU-länder - med mera. Du kan navigera på webbplatsen på 27 språk, och det är enkelt att söka efter objekt som beskrivs på ditt eget språk. Men det blir mer komplicerat när du vill se objekt som matchar din sökning men beskrivs på ett annat språk.
Sammanlagt används 37 språk för att beskriva samlingarna. Men mer än hälften av allt material (57%) använder ett av bara fem språk - engelska, tyska, holländska, norska eller franska.
Att göra ett objekt som beskrivs på ett språk dyker upp i resultaten eller relaterat material när man söker på ett annat språk är inte lätt. Och vi vet att vi har en lång väg att gå, men att göra positiva förändringar på detta område är en av våra prioriteringar.
Vårt mål
Vi vill att människor ska hitta det de letar efter – även om de inte använder det språk som deras målobjekt beskrivs på.
Vi vill öka chanserna att söka efter något på ett språk ger resultat som matchar dina kriterier på ett annat språk.
Utmaningar
Automatisk översättning blir bättre, men det är inte idiotsäkert som du har sett om du någonsin har använt ett onlineverktyg som Google Translate. När det gäller Europeana Collections tillkommer ytterligare komplikationer. Vi koncentrerar oss inte på att ett visst språk ska översättas till ett annat. Vi arbetar med samlingar som beskrivs på 37 språk och försöker matcha dem med söktermer som kan komma på vilket språk som helst. Dessutom är metadata inte som naturligt språk med fullständiga meningar och förutsägbar grammatik. Den presenteras ofta i korta fraser eller till och med enstaka ord, vilket innebär att det är svårt att hitta det sammanhang som krävs för en korrekt översättning. Att lägga till ett annat lager av komplexitet är det faktum att de termer som används kan vara mycket specifika - de kan se ut som en vanlig term men har en annan betydelse när de används i samband med att beskriva digitalt kulturellt material.
Automatiserade processer kan bara fungera när de matas korrekt och lämplig information. Det låter självklart, men som vi har sett i de tidigare inläggen i denna serie varierar informationen till Europeana kraftigt i fråga om djup och kvalitet.
För att något ska kunna översättas måste vi veta vilket språk det ursprungliga elementet tillhandahålls i. Våra system kommer inte att gissa. Så varje element (som titel och beskrivning) behöver en språkmarkör. Det är ytterligare ett informationslager som kulturarvsinstitutioner måste tillhandahålla.
Vad vi gör
Nya innovationer
I år reviderade vi vår kvalitetsstandard, Europeana Publishing Framework, för att inkludera standarder för metadata utöver de befintliga standarderna för innehåll. Nu uppmuntrar det de personer som arbetar med metadata att översätta element som titlar till flera språk och att inkludera kontextliknande platsnamn - som själva är flerspråkiga - från kontextuella ordförråd (se punkt nedan). Ramverket uppmuntrar också användningen av dessa viktiga språktaggar för att visa vilket språk som används. Detta tar bort gissningen och innebär att fler automatiska länknings- och översättningsprocesser kan implementeras.
Förutom att använda expertis från Europeana Foundation and Network Association förlitar vi oss på andras arbete för att förbättra flerspråkigheten i Europeana Collections. Under det gångna året genomförde vi ett pilotprojekt med eTranslation-teamet - ett annat EU-finansierat DSI-projekt. Vi bygger nu vidare på detta pilotprojekt med ytterligare experimentverksamhet i syfte att dra nytta av projektets potential för automatisk översättning för Europeana.
Pågående verksamhet
När en fras ges rätt sammanhang är det mycket lättare att översätta den. Vi fortsätter att använda metadataberikning för att ge mer sammanhang för det material du hittar på Europeana Collections. Våra insatser här omfattar användning av ”kontextuella ordförråd”, särskilt sådana som finns tillgängliga som länkade öppna data. Dessa dataset ger oss ytterligare detaljer som flerspråkiga etiketter, översättningar av nyckelbegrepp eller olika varianter av namn för människor och platser. Detta gör det lättare för människor att söka efter och hitta föremål på Europeana Collections. Ordlistor kan användas antingen av dataleverantörer eller av Europeana som en del av olika (halv-)automatiska processer för anrikning av metadata.
Europa är flerspråkigt. Det måste vi också vara. Vi vill tacka våra partner och vänner för att de hjälper oss att översätta viktiga delar som Europeanas publiceringsramverk och de rättighetsförklaringar som Europeana använder (den information som berättar vad du kan göra med en artikel som du hittar på Europeana, t.ex. om den är upphovsrättsskyddad eller offentlig?) till fler språk. Hittills har rättighetsförklaringarna fått sju översättningar och ytterligare sex är på väg.
Europeana Collections webbplats finns på 27 språk, och i år släppte vi en ny utställning - Heritage at Risk - på sju språk.
Vad man ska se upp för...
Att göra Europeana mer flerspråkigt är en prioritering och ämnet för ett tvådagarsevenemang i oktober under Finlands ordförandeskap i Europeiska unionens råd. Under evenemanget kommer Europeana Foundation och undervisnings- och kulturministeriet att fokusera på behov, förväntningar och vägar framåt för flerspråkighet i det digitala kulturarvet.
Du kan också hjälpa till. Tillsammans med våra partner anordnar vi ”Transcribathon”-evenemang som inbjuder vem som helst att delta (antingen hemma på nätet eller vid ett fysiskt evenemang) och skriver in innehållet i ofta handskrivna textdokument så att det blir lättare att komma åt och söka efter dem, och så att de kan maskinöversättas. Under det senaste året organiserades fem transkribatoner i samarbete med kulturarvsinstitutioner i hela Europa (Tyskland, Italien, Belgien, Österrike och Rumänien) och nästan 3 000 dokument med anknytning till första världskriget transkriberades.
Läs mer
Läs mer om våra automatiska berikningar eller EU:s eTranslation-verksamhet.
Och om du är intresserad av de fina detaljerna om språkdelen i Europeanas publiceringsramverk kan du också se Europeanas publiceringsguide, som beskriver exakt vad som krävs när du skickar in uppgifter till Europeana.
EuropeanaTech har gjort insatser på området flerspråkighet, se t.ex. Best Practices for Multilingual Access och de olika presentationerna om språkfrågor vid den senaste EuropeanaTech-konferensen.
Och bidra till att göra Europeana mer flerspråkigt genom att gå med på Transcribathon.eu. Där hittar du handledningar som hjälper dig att komma igång på engelska, franska och tyska samt information om våra kommande evenemang.
