Kopš 2015. gada janvāra Europeana ir viena no Eiropas Savienības digitālo pakalpojumu infrastruktūrām (DSI). ES ir vairākas no tām, citas ietver drošāku internetu bērniem, elektroniskos veselības aprūpes pakalpojumus un uzņēmējdarbības pārvaldību. Europeana DSI demonstrē un nodrošina tiešsaistes piekļuvi Eiropas kultūras un zinātniskajam mantojumam, izmantojot platformu Europeana Collections, un atbalsta kultūras mantojuma iestādes, tām pielāgojoties šim digitālajam laikmetam.
Pagājušajā gadā Eiropas Komisija publicēja Europeana novērtējumu, kurā izklāstīti mūsu sasniegumi un dažas jomas, kurām jāpievēršas nākamajām. Šajā sērijā mēs aplūkosim dažas Europeana DSI darbības, kuras novērtējumā tika uzskatītas par prioritārām, sniedzot jums labāku izpratni par centieniem un problēmām, pie kurām mēs pašlaik strādājam.
Valodai, kurā runājat, nevajadzētu būt šķērslim, lai atrastu to, ko vēlaties Europeana kolekcijās, bet tieši tagad tā varētu būt. Uzziniet, ko mēs darām, lai to labotu.
Europeana kolekcijās ir materiāli no galerijām, bibliotēkām, arhīviem un muzejiem visās 28 ES dalībvalstīs. Jūs varat pārlūkot tīmekļa vietni 27 valodās, un ir viegli meklēt vienumus, kas aprakstīti jūsu valodā. Bet lietas kļūst sarežģītākas, ja vēlaties redzēt vienumus, kas atbilst jūsu meklēšanai, bet ir aprakstīti citā valodā.
Kopumā 37 valodas tiek izmantotas, lai aprakstītu kolekcijas. Tomēr vairāk nekā puse no visa materiāla (57%) izmanto vienu no tikai piecām valodām - angļu, vācu, holandiešu, norvēģu vai franču.
Vienā valodā aprakstītā vienuma parādīšanās rezultātos vai saistītajā materiālā, meklējot citā valodā, nav vienkārša. Un mēs zinām, ka mums vēl ir tāls ceļš ejams, bet pozitīvas pārmaiņas šajā jomā ir viena no mūsu prioritātēm.
Mūsu mērķis
Mēs vēlamies, lai cilvēki atrastu to, ko viņi meklē, pat ja viņi neizmanto valodu, kurā ir aprakstīts viņu mērķa jautājums.
Mēs vēlamies palielināt izredzes, ka, meklējot kaut ko vienā valodā, tiek iegūti rezultāti, kas atbilst jūsu kritērijiem citā valodā.
Problēmas
Automātiskā tulkošana uzlabojas, bet tā nav muļķīga, kā jūs redzējāt, ja kādreiz esat izmantojis tādu tiešsaistes rīku kā Google Translate. Europeana kolekciju gadījumā rodas papildu sarežģījumi. Mēs nekoncentrējamies uz to, lai viena konkrēta valoda tiktu tulkota citā valodā. Mēs strādājam ar kolekcijām, kas aprakstītas 37 valodās, un cenšamies tās saskaņot ar meklētajiem terminiem, kas varētu būt jebkurā valodā. Turklāt metadati nav līdzīgi dabiskajai valodai ar pilniem teikumiem un paredzamu gramatiku; tas bieži tiek pasniegts īsās frāzēs vai pat atsevišķos vārdos, kas nozīmē, ka ir grūti atrast kontekstu, kas nepieciešams precīzam tulkojumam. Vēl viens sarežģītības slānis ir tas, ka izmantotie termini var būt ļoti specifiski - tie var izskatīties kā kopīgs termins, bet tiem ir atšķirīga nozīme, ja tos lieto saistībā ar digitālā kultūras materiāla aprakstīšanas kontekstu.
Automatizēti procesi var darboties tikai tad, ja tiem tiek ievadīta pareiza un atbilstoša informācija. Tas izklausās pašsaprotami, bet, kā esam redzējuši iepriekšējos šīs sērijas ierakstos, Europeana sniegtā informācija ir ļoti atšķirīga tās dziļuma un kvalitātes ziņā.
Lai kaut ko varētu iztulkot, mums ir jāzina, kādā valodā tiek nodrošināts oriģinālais elements. Mūsu sistēmas nebūs uzminēt. Tātad katram elementam (piemēram, nosaukumam un aprakstam) ir nepieciešams valodas marķieris. Tas ir vēl viens informācijas slānis, kas kultūras mantojuma iestādēm ir jāsniedz.
Ko mēs darām
Jauni jauninājumi
Šogad mēs pārskatījām savu kvalitātes standartu Europeana Publishing Framework, lai papildus esošajiem satura standartiem iekļautu metadatu standartus. Tagad tas mudina cilvēkus, kas strādā ar metadatiem, tulkot tādus elementus kā nosaukumi vairākās valodās un iekļaut kontekstu, piemēram, vietvārdus, kas paši ir daudzvalodīgi, no kontekstuālajām vārdnīcām (sk. punktu turpmāk). Nostādnes arī mudina izmantot šos ļoti svarīgos valodas marķējumus, lai norādītu, kura valoda tiek lietota. Tas ietver minējumus un nozīmē, ka var ieviest automātiskākus sasaistes un tulkošanas procesus.
Mēs ne tikai izmantojam Europeana fonda un tīkla asociācijas speciālās zināšanas, bet arī paļaujamies uz citu darbu, lai uzlabotu daudzvalodību Europeana kolekcijās. Pagājušajā gadā mēs kopā ar eTranslation komandu īstenojām izmēģinājuma projektu, kas ir vēl viens Eiropas Savienības finansēts DVI projekts. Tagad mēs balstāmies uz šo izmēģinājuma projektu ar turpmākiem eksperimentu pasākumiem, lai izmantotu projekta automātiskās tulkošanas potenciālu Europeana vajadzībām.
Notiekošie pasākumi
Ja frāzei ir dots pareizais konteksts, to ir daudz vieglāk iztulkot. Mēs turpinām izmantot metadatu bagātināšanu, lai nodrošinātu plašāku kontekstu materiāliem, kas atrodami Europeana kolekcijās. Mūsu centieni šajā jomā ietver “kontekstuālu vārdnīcu” izmantošanu, jo īpaši tādu vārdnīcu izmantošanu, kas pieejamas kā saistītie atvērtie dati. Šīs datu kopas sniedz mums papildu informāciju, piemēram, daudzvalodu etiķetes, galveno jēdzienu tulkojumus vai dažādus cilvēku un vietu nosaukumu variantus. Tādējādi cilvēkiem ir vieglāk meklēt un atrast vienumus Europeana kolekcijās. Vārdnīcas var izmantot vai nu datu sniedzēji, vai Europeana kā daļu no dažādiem (daļēji) automātiskiem metadatu bagātināšanas procesiem.
Eiropa ir daudzvalodīga. Mums arī jābūt. Esam pateicīgi saviem partneriem un draugiem par palīdzību tulkot vairākās valodās svarīgus elementus, piemēram, Europeana publicēšanas satvaru un Europeana izmantotos paziņojumus par tiesībām (informāciju, kas jums parāda, ko varat darīt ar kādu Europeana vietnē atrodamu priekšmetu, piemēram, vai tas ir autortiesības vai publiski pieejams?). Līdz šim paziņojumiem par tiesībām ir septiņi tulkojumi, un vēl seši ir ceļā.
Europeana Collections tīmekļa vietne ir pieejama 27 valodās, un šogad mēs izlaidām jaunu izstādi - Heritage at Risk - septiņās valodās.
Ko meklēt...
Viena no prioritātēm ir padarīt Europeana daudzvalodīgāku, un šā gada oktobrī Somijas prezidentūras ES Padomē laikā notiks divu dienu pasākums. Pasākumā piedalīsies Europeana fonds un Somijas Izglītības un kultūras ministrija, galveno uzmanību pievēršot vajadzībām, cerībām un turpmākajai virzībai uz daudzvalodību digitālā kultūras mantojuma jomā.
Jūs varat arī palīdzēt. Kopā ar mūsu partneriem mēs rīkojam “Transcribathon” pasākumus, kuros ikviens tiek aicināts pievienoties (vai nu mājās tiešsaistē, vai klātienē) un ierakstīt bieži vien ar roku rakstītu teksta dokumentu saturu, lai pēc tam tiem varētu vieglāk piekļūt un meklēt, kā arī lai tos varētu mašīntulkot. Pagājušajā gadā sadarbībā ar mantojuma iestādēm visā Eiropā (Vācijā, Itālijā, Beļģijā, Austrijā, Rumānijā) tika organizēti pieci transkribati un pārrakstīti gandrīz 3000 dokumentu, kas saistīti ar Pirmo pasaules karu.
Uzzināt vairāk
Uzziniet vairāk par mūsu automātisko bagātināšanu vai Eiropas Savienības eTranslation darbību.
Un, ja jūs interesē sīka informācija par Europeana publicēšanas sistēmas valodas elementu, jūs varat redzēt arī Europeana publicēšanas rokasgrāmatu, kurā ir precīzi izklāstīts, kas ir nepieciešams, iesniedzot datus Europeana.
EuropeanaTech ir pielikusi pūles daudzvalodības jomā, sk., piemēram, Paraugpraksi daudzvalodu piekļuvei un dažādās prezentācijas par valodu jautājumu risināšanu pēdējā EuropeanaTech konferencē.
Un palīdzi padarīt Europeana daudzvalodīgāku, pievienojoties portālam Transcribathon.eu. Tur atradīsit pamācības angļu, franču un vācu valodā, kā arī informāciju par mūsu turpmākajiem pasākumiem.
