Siden januar 2015 har Europeana været en af Den Europæiske Unions digitaltjenesteinfrastrukturer (DSI). EU har flere af dem, andre omfatter sikrere internet for børn, elektroniske sundhedstjenester og virksomhedsledelse. Europeana DSI viser og giver onlineadgang til Europas kulturelle og videnskabelige arv gennem Europeana Collections-platformen og støtter kulturarvsinstitutioner, når de tilpasser sig denne digitale tidsalder.
Sidste år offentliggjorde Europa-Kommissionen en evaluering af Europeana, som skitserede vores resultater og nogle områder, der skal fokuseres på næste år. I denne serie vil vi se på nogle af de Europeana DSI-aktiviteter, som evalueringen anså for at være en prioritet, hvilket giver dig en større forståelse af de bestræbelser og udfordringer, vi arbejder på lige nu.
Det sprog, du taler, bør ikke være en hindring for at finde det, du ønsker på Europeana Collections, men lige nu kan det være. Find ud af, hvad vi gør for at rette op på det.
Europeana Collections indeholder materiale fra gallerier, biblioteker, arkiver og museer i alle 28 EU-lande - og meget mere. Du kan navigere på webstedet på 27 sprog, og det er nemt at søge efter elementer, der er beskrevet på dit eget sprog. Men tingene bliver mere komplicerede, når du vil se elementer, der matcher din søgning, men er beskrevet på et andet sprog.
I alt 37 sprog bruges til at beskrive samlingerne. Men mere end halvdelen af alt materiale (57%) bruger et af kun fem sprog - engelsk, tysk, hollandsk, norsk eller fransk.
Det er ikke let at få et emne, der er beskrevet på ét sprog, til at dukke op i resultaterne eller relateret materiale, når der søges efter det på et andet sprog. Og vi ved, at vi har lang vej endnu, men at foretage positive ændringer på dette område er en af vores prioriteter.
Vores mål
Vi ønsker, at folk skal finde det, de leder efter – også selv om de ikke bruger det sprog, som deres målelement er beskrevet på.
Vi ønsker at øge chancerne for, at søgning efter noget på ét sprog giver resultater, der matcher dine kriterier på et andet sprog.
Udfordringer
Automatisk oversættelse bliver bedre, men det er ikke idiotsikkert, som du har set, hvis du nogensinde har brugt et onlineværktøj som Google Translate. I tilfælde af Europeana Collections er der yderligere komplikationer. Vi koncentrerer os ikke om, at et bestemt sprog oversættes til et andet. Vi arbejder med samlinger, der er beskrevet på 37 sprog, og forsøger at matche dem med søgeord, der kan findes på et hvilket som helst sprog. Desuden er metadata ikke som naturligt sprog med hele sætninger og forudsigelig grammatik. Det præsenteres ofte i korte sætninger eller endda enkeltord, hvilket betyder, at det er svært at finde den kontekst, der er nødvendig for en nøjagtig oversættelse. Tilføjelse af et andet lag af kompleksitet er det faktum, at de anvendte udtryk kan være meget specifikke - de kan ligne et fælles udtryk, men har en anden betydning, når de anvendes i forbindelse med at beskrive digitalt kulturelt materiale.
Automatiserede processer kan kun fungere, når de tilføres de korrekte og relevante oplysninger. Det lyder indlysende, men som vi har set i de tidligere indlæg i denne serie, varierer de oplysninger, der gives til Europeana, meget med hensyn til dybde og kvalitet.
For at noget kan oversættes, skal vi vide, hvilket sprog det oprindelige element leveres på. Vores systemer vil ikke gætte. Så hvert element (som titel og beskrivelse) har brug for en sprogmarkør. Det er endnu et lag af information, som kulturarvsinstitutioner skal give.
Hvad vi gør
Nye innovationer
I år reviderede vi vores kvalitetsstandard, Europeana Publishing Framework, for at medtage standarder for metadata ud over de eksisterende standarder for indhold. Nu opfordrer det de mennesker, der arbejder med metadata, til at oversætte elementer som titler til flere sprog og til at inkludere kontekstlignende stednavne - som selv er flersprogede - fra kontekstuelle ordforråd (se punkt nedenfor). Rammen tilskynder også til brug af disse vigtige sprogmærker for at vise, hvilket sprog der bruges. Dette tager gætteriet ud og betyder, at der kan implementeres flere automatiske link- og oversættelsesprocesser.
Ud over at bruge ekspertise fra Europeana Foundation og Network Association er vi afhængige af andres arbejde for at forbedre flersprogetheden på Europeana Collections. I det forløbne år har vi gennemført et pilotprojekt med eTranslation-teamet - et andet EU-finansieret DSI-projekt. Vi bygger nu videre på dette pilotprojekt med yderligere forsøgsaktiviteter med henblik på at udnytte projektets potentiale for automatisk oversættelse for Europeana.
Igangværende aktiviteter
Når en sætning får den rette kontekst, er det meget lettere at oversætte den. Vi fortsætter med at bruge metadataberigelse til at skabe mere kontekst for det materiale, du finder på Europeana Collections. Vores indsats her omfatter brugen af "kontekstuelle ordforråd", navnlig dem, der er tilgængelige som sammenkædede åbne data. Disse datasæt giver os yderligere oplysninger som flersprogede etiketter, oversættelser af nøglebegreber eller forskellige varianter af navne til personer og steder. Dette gør det lettere for folk at søge efter og finde genstande på Europeana Collections. Ordforråd kan anvendes enten af dataleverandører eller af Europeana som led i forskellige (semi-)automatiske processer til berigelse af metadata.
Europa er flersproget. Det skal vi også være. Vi takker vores partnere og venner for at hjælpe os med at oversætte vigtige elementer som Europeana Publishing Framework og de rettighedserklæringer, som Europeana bruger (de oplysninger, der fortæller dig, hvad du kan gøre med en vare, du finder på Europeana, f.eks. om den er ophavsretlig eller offentligt tilgængelig?), til flere sprog. Indtil videre har rettighedserklæringerne syv oversættelser, og yderligere seks er på vej.
Europeana Collections' hjemmeside er tilgængelig på 27 sprog, og i år udgav vi en ny udstilling - Heritage at Risk - på syv sprog.
Hvad skal man være opmærksom på...
At gøre Europeana mere flersproget er en prioritet og emnet for et todages arrangement i oktober under Finlands formandskab for Rådet for Den Europæiske Union. Ved arrangementet vil Europeana Foundation og det finske ministerium for uddannelse og kultur fokusere på behov, forventninger og veje frem for flersprogethed i den digitale kulturarv.
Du kan også hjælpe. Sammen med vores partnere afholder vi "Transcribathon"-arrangementer, hvor alle opfordres til at deltage (enten hjemme online eller ved et fysisk arrangement) og indtaste indholdet af ofte håndskrevne tekstdokumenter, så de lettere kan tilgås og søges, og så de kan maskinoversættes. I det seneste år blev der afholdt fem transcribathons i samarbejde med kulturarvsinstitutioner i hele Europa (Tyskland, Italien, Belgien, Østrig og Rumænien), og næsten 3 000 dokumenter vedrørende første verdenskrig blev transskriberet.
Læs mere
Få mere at vide om vores automatiske berigninger eller Den Europæiske Unions eTranslation-aktivitet.
Og hvis du er interesseret i de detaljerede oplysninger om sprogelementet i Europeana Publishing Framework, kan du også se Europeana Publishing Guide, som indeholder præcise oplysninger om, hvad der kræves, når der indsendes data til Europeana.
EuropeanaTech har gjort en indsats inden for flersprogethed, se f.eks. bedste praksis for flersproget adgang og de forskellige præsentationer om håndtering af sprogspørgsmål på den seneste EuropeanaTech-konference.
Og vær med til at gøre Europeana mere flersproget ved at deltage på Transcribathon.eu. Her kan du finde vejledninger, der kan hjælpe dig med at komme i gang på engelsk, fransk og tysk, samt oplysninger om vores næste arrangementer.
