Europeana je od siječnja 2015. jedna od infrastruktura digitalnih usluga Europske unije (DSI). EU ima nekoliko od njih, a druge uključuju sigurniji internet za djecu, elektroničke zdravstvene usluge i poslovno upravljanje. Europeana DSI predstavlja i omogućuje internetski pristup europskoj kulturnoj i znanstvenoj baštini putem platforme Europeana Collections te podupire institucije kulturne baštine u njihovoj prilagodbi tom digitalnom dobu.
Prošle je godine Europska komisija objavila evaluaciju Europeane , u kojoj su navedena naša postignuća i neka područja na koja se treba usredotočiti. U ovoj ćemo seriji razmotriti neke od aktivnosti DSI-ja Europeane koje je evaluacija smatrala prioritetom, što će vam omogućiti bolje razumijevanje nastojanja i izazova na kojima trenutačno radimo.
Jezik koji govorite ne bi trebao biti prepreka za pronalaženje onoga što želite u zbirkama Europeane, ali trenutačno bi to mogao biti. Saznajte što činimo kako bismo to ispravili.
Europeana Zbirke sadrže materijale iz galerija, knjižnica, arhiva i muzeja u svih 28 država članica EU-a - i još mnogo toga. Web-mjesto možete pretraživati na 27 jezika, a stavke opisane na vašem jeziku lako je pretraživati. Ali stvari postaju kompliciranije kada želite vidjeti stavke koje odgovaraju vašem pretraživanju, ali su opisane na drugom jeziku.
Ukupno se koristi 37 jezika za opisivanje zbirki. Međutim, više od polovice materijala (57%) koristi jedan od samo pet jezika - engleski, njemački, nizozemski, norveški ili francuski.
Izrada stavke opisane na jednom jeziku pojavljuje se u rezultatima ili povezanom materijalu kada se traži na drugom jeziku nije lako. Znamo da je dug put pred nama, ali pozitivne promjene u tom području jedan su od naših prioriteta.
Naš cilj
Želimo da ljudi pronađu ono što traže, čak i ako ne upotrebljavaju jezik na kojem je opisana njihova ciljna stavka.
Želimo povećati šanse da potraga za nečim na jednom jeziku donese rezultate koji odgovaraju vašim kriterijima na drugom jeziku.
Izazovi
Automatsko prevođenje postaje sve bolje, ali nije sigurno kao što ste vidjeli ako ste ikada koristili internetski alat kao što je Google Translate. U slučaju kolekcija Europeana postoje dodatne komplikacije. Ne usredotočujemo se na prijevod jednog određenog jezika na drugi. Radimo s zbirkama opisanima na 37 jezika i pokušavamo ih uskladiti s pojmovima za pretraživanje koji bi mogli doći na bilo kojem jeziku. Osim toga, metapodaci nisu poput prirodnog jezika s punim rečenicama i predvidljivom gramatikom; često se prikazuje u kratkim frazama ili čak pojedinačnim riječima, što znači da je teško pronaći kontekst potreban za točan prijevod. Dodavanje još jednog sloja složenosti je činjenica da korišteni pojmovi mogu biti vrlo specifični - oni mogu izgledati kao zajednički pojam, ali imaju drugačije značenje kada se koriste u kontekstu opisivanja digitalnog kulturnog materijala.
Automatizirani procesi mogu raditi samo kada su hranjeni točnim i odgovarajućim informacijama. To zvuči očito, ali kao što smo vidjeli u prethodnim objavama u ovoj seriji, informacije koje se pružaju Europeani uvelike se razlikuju u pogledu njihove dubine i kvalitete.
Da bi bilo što bilo prevedeno, moramo znati na kojem se jeziku nalazi izvorni element. Naši sustavi neće pogoditi. Dakle, svaki element (poput naslova i opisa) treba jezični marker. To je još jedna razina informacija koju institucije kulturne baštine trebaju pružiti.
Što radimo
Nove inovacije
Ove smo godine revidirali naš standard kvalitete, Europeana Publishing Framework, kako bismo uključili standarde za metapodatke uz postojeće standarde za sadržaj. Sada potiče ljude koji rade na metapodacima da prevedu elemente kao što su naslovi na više jezika i da uključe kontekst kao što su imena mjesta, koja su sama višejezična, iz kontekstualnih rječnika (vidjeti točku u nastavku). Okvirom se također potiče upotreba tih važnih jezičnih oznaka kako bi se pokazalo koji se jezik upotrebljava. To uzima nagađanje i znači da se može provesti više procesa automatskog povezivanja i prevođenja.
Osim što koristimo stručno znanje iz Zaklade Europeana i Udruženja mreža, oslanjamo se i na rad drugih kako bismo poboljšali višejezičnost zbirki Europeana. Protekle godine proveli smo pilot-projekt s timom za eTranslation - još jedan DSI projekt koji financira Europska unija. Nadovezujemo se na taj pilot-projekt daljnjim aktivnostima eksperimentiranja kako bismo iskoristili potencijal projekta za automatsko prevođenje za Europeanu.
Aktivnosti u tijeku
Kada se izrazu daje pravi kontekst, mnogo ga je lakše prevesti. Nastavljamo koristiti obogaćivanje metapodataka kako bismo pružili više konteksta za materijal koji pronađete na Europeana Collections. Naši napori ovdje uključuju upotrebu „kontekstualnih rječnika”, posebno onih dostupnih kao povezani otvoreni podaci. Ovi skupovi podataka daju nam dodatne pojedinosti kao što su višejezične oznake, prijevodi ključnih koncepata ili različite varijante imena za ljude i mjesta. Time se ljudima olakšava traženje i pronalaženje artikala u zbirkama Europeana. Rječnike mogu upotrebljavati pružatelji podataka ili Europeana u okviru različitih (polu)automatskih postupaka obogaćivanja metapodataka.
Europa je višejezična. I mi moramo biti. Zahvalni smo našim partnerima i prijateljima što su nam pomogli da važne elemente kao što su Europeana Publishing Framework i izjave o pravima koje Europeana upotrebljava (informacije koje vam govore što možete učiniti s predmetom koji pronađete na Europeani, npr. je li zaštićen autorskim pravom ili u javnoj domeni?) prevedemo na više jezika. Do sada, izjave o pravima imaju sedam prijevoda s još šest na putu.
Internetska stranica Europeana Collections dostupna je na 27 jezika, a ove smo godine objavili novu izložbu - Heritage at Risk - na sedam jezika.
Što treba paziti...
Povećanje višejezičnosti Europeane prioritet je i tema dvodnevnog događanja u listopadu tijekom finskog predsjedanja Vijećem EU-a. Na događanju će se Zaklada Europeana i finsko Ministarstvo obrazovanja i kulture usredotočiti na potrebe, očekivanja i daljnje korake u pogledu višejezičnosti u digitalnoj kulturnoj baštini.
I ti možeš pomoći. S našim partnerima organiziramo događanja „Transcribathon” na kojima pozivamo sve da se pridruže (bilo kod kuće na internetu ili na fizičkom događanju) i upišemo sadržaj često rukom pisanih tekstualnih dokumenata kako bi im se lakše moglo pristupiti i pretraživati ih te kako bi ih se moglo strojno prevesti. Prošle godine organizirano je pet transkribata u suradnji s baštinskim institucijama diljem Europe (Njemačka, Italija, Belgija, Austrija, Rumunjska), a prepisano je gotovo 3000 dokumenata povezanih s Prvim svjetskim ratom.
Saznajte više
Saznajte više o našim automatskim obogaćivanjima ili aktivnostima Europske unije eTranslation.
Ako vas zanimaju fine pojedinosti o jezičnom elementu okvira za objavljivanje Europeana, možete vidjeti i Vodič za objavljivanje Europeana, u kojem se točno navodi što je potrebno za dostavljanje podataka Europeani.
EuropeanaTech uložio je napore u području višejezičnosti, vidjeti, primjerice, primjere najbolje prakse za višejezični pristup i razne prezentacije o rješavanju jezičnih pitanja na posljednjoj konferenciji EuropeanaTecha.
Pridružite se platformi Transcribathon.eu i pomozite da Europeana postane višejezična. Tamo ćete pronaći vodiče koji će vam pomoći da započnete s radom na engleskom, francuskom i njemačkom jeziku, kao i informacije o našim sljedećim događanjima.
