Nuo 2015 m. sausio mėn. „Europeana“ yra viena iš Europos Sąjungos skaitmeninių paslaugų infrastruktūrų (SSI). Kelios iš jų yra ES, kitos apima saugesnį internetą vaikams, elektronines sveikatos priežiūros paslaugas ir verslo valdymą. „Europeana DSI“ pristato Europos kultūros ir mokslo paveldą ir suteikia internetinę prieigą prie jo per platformą „Europeana Collections“ ir remia kultūros paveldo įstaigas joms prisitaikant prie šio skaitmeninio amžiaus.
Praėjusiais metais Europos Komisija paskelbė EUROPEANA vertinimą, kuriame išdėstyti mūsų laimėjimai ir kai kurios sritys, į kurias reikia sutelkti dėmesį toliau. Šioje serijoje apžvelgsime kai kurią Europeanos DSI veiklą, kuriai vertinime buvo teikiama pirmenybė, kad geriau suprastumėte, kokių pastangų ir iššūkių šiuo metu dedame.
Kalba, kuria kalbate, neturėtų būti kliūtis rasti tai, ko norite Europeanos kolekcijose, tačiau šiuo metu taip gali būti. Sužinokite, ką darome, kad tai ištaisytume.
Europeana kolekcijose yra medžiagos iš visų 28 ES valstybių narių galerijų, bibliotekų, archyvų ir muziejų ir kt. Galite naršyti svetainėje 27 kalbomis ir lengvai ieškoti savo gimtąja kalba aprašytų elementų. Tačiau viskas tampa sudėtingiau, kai norite matyti elementus, kurie atitinka jūsų paiešką, bet yra aprašyti kita kalba.
Iš viso kolekcijoms apibūdinti vartojamos 37 kalbos. Tačiau daugiau nei pusė visos medžiagos (57%) naudoja tik vieną iš penkių kalbų - anglų, vokiečių, olandų, norvegų ar prancūzų.
Viena kalba aprašyto elemento pateikimas rezultatuose ar susijusioje medžiagoje, kai ieškoma kita kalba, nėra lengvas. Žinome, kad dar turime daug nuveikti, tačiau teigiamų pokyčių šioje srityje įgyvendinimas yra vienas iš mūsų prioritetų.
Mūsų tikslas
Norime, kad žmonės rastų tai, ko ieško, net jei jie nevartoja kalbos, kuria aprašytas jų tikslinis elementas.
Norime padidinti tikimybę, kad ieškodami kažko viena kalba pasieksite rezultatų, atitinkančių jūsų kriterijus kita kalba.
Iššūkiai
Automatinis vertimas gerėja, tačiau tai nėra kvaila, nes matėte, ar kada nors naudojotės tokia internetine priemone kaip „Google Translate“. Europeanos kolekcijų atveju yra papildomų komplikacijų. Nekreipiame dėmesio į tai, kad viena konkreti kalba būtų verčiama į kitą. Dirbame su kolekcijomis, aprašytomis 37 kalbomis, ir bandome jas sugretinti su paieškos terminais, kurie gali būti pateikiami bet kuria kalba. Be to, metaduomenys nepanašūs į natūraliąją kalbą su išsamiais sakiniais ir nuspėjama gramatika; jis dažnai pateikiamas trumpomis frazėmis ar net pavieniais žodžiais, o tai reiškia, kad sunku rasti tiksliam vertimui reikalingą kontekstą. Dar vienas sudėtingumo sluoksnis yra tai, kad vartojami terminai gali būti labai konkretūs - jie gali atrodyti kaip bendras terminas, tačiau turi kitokią reikšmę, kai jie vartojami skaitmeninės kultūrinės medžiagos apibūdinimo kontekste.
Automatizuoti procesai gali veikti tik tada, kai jiems pateikiama teisinga ir tinkama informacija. Tai atrodo akivaizdu, tačiau, kaip matėme ankstesniuose šios serijos įrašuose, Europeanai pateikta informacija labai skiriasi savo išsamumu ir kokybe.
Kad kas nors būtų išversta, turime žinoti, kokia kalba pateikiamas originalus elementas. Mūsų sistema neatspėja. Taigi kiekvienam elementui (pvz., Pavadinimui ir aprašymui) reikia kalbos žymeklio. Tai dar vienas informacijos, kurią turi teikti kultūros paveldo įstaigos, lygmuo.
Ką mes darome
Naujos inovacijos
Šiais metais peržiūrėjome savo kokybės standartą Europeana Publishing Framework, įtraukdami ne tik esamus turinio standartus, bet ir metaduomenų standartus. Dabar ji skatina žmones, dirbančius su metaduomenimis, išversti tokius elementus kaip pavadinimai į kelias kalbas ir įtraukti kontekstą, pvz., Vietovių pavadinimus, kurie patys yra daugiakalbiai, iš kontekstinių žodynų (žr. Sistemoje taip pat skatinama naudoti šias labai svarbias kalbos žymas, kad būtų parodyta, kokia kalba vartojama. Tai apima spėliones ir reiškia, kad galima įgyvendinti daugiau automatinių susiejimo ir vertimo procesų.
Pasitelkdami "Europeanos" fondo ir tinklo asociacijos ekspertines žinias, pasikliaujame kitų darbu, kad pagerintume daugiakalbystę "Europeanos" kolekcijose. Praėjusiais metais kartu su „eTranslation“ komanda įgyvendinome bandomąjį projektą – dar vieną Europos Sąjungos finansuojamą DSI projektą. Dabar, remdamiesi šiuo bandomuoju projektu, vykdome tolesnę eksperimentinę veiklą, kad išnaudotume projekto automatinio vertimo potencialą Europeanoje.
Vykdoma veikla
Kai frazei suteikiamas tinkamas kontekstas, ją daug lengviau išversti. Mes ir toliau naudojame metaduomenų papildymą, kad suteiktume daugiau konteksto medžiagai, kurią rasite Europeanos kolekcijose. Mūsų pastangos apima kontekstinių žodynų, ypač tokių, kurie pateikiami kaip susietieji atvirieji duomenys, naudojimą. Šiuose duomenų rinkiniuose pateikiama papildomos informacijos, pvz., daugiakalbės etiketės, pagrindinių sąvokų vertimai arba skirtingi žmonių ir vietų vardų variantai. Dėl to žmonėms lengviau ieškoti prekių ir jas rasti „Europeanos“ kolekcijose. Duomenų teikėjai arba Europeana gali naudoti žodynus kaip įvairių (pusiau) automatinių metaduomenų praturtinimo procesų dalį.
Europa yra daugiakalbė. Mes taip pat turime būti. Dėkojame savo partneriams ir draugams už tai, kad padėjo mums išversti svarbius elementus, pvz., „Europeanos“ leidybos sistemą ir pareiškimus apie teises, kuriuos naudoja „Europeana“ (informaciją apie tai, ką galite daryti su „Europeanoje“ rastu elementu, pvz., autorių teisių ar viešojo naudojimo?), į daugiau kalbų. Iki šiol pareiškimai apie teises turi septynis vertimus, o dar šeši yra pakeliui.
Europeanos kolekcijų svetainė yra prieinama 27 kalbomis, o šiais metais septyniomis kalbomis išleidome naują parodą "Paveldas pavojuje".
Į ką atkreipti dėmesį...
Europos skaitmeninės bibliotekos EUROPEANA daugiakalbystės didinimas yra prioritetas ir dviejų dienų renginio, vyksiančio šį spalio mėn. Suomijai pirmininkaujant ES Tarybai, tema. Renginyje dalyvaus fondas „Europeana“ ir Suomijos švietimo ir kultūros ministerija, daugiausia dėmesio skirdami daugiakalbystės skaitmeniniame kultūros pavelde poreikiams, lūkesčiams ir tolesniems veiksmams.
Jūs taip pat galite padėti. Kartu su savo partneriais rengiame transkribavimo renginius, kuriuose kviečiame visus prisijungti (namuose internetu arba per fizinį renginį) ir suvedame dažnai ranka rašytų tekstinių dokumentų turinį, kad juos būtų lengviau rasti ir atlikti paiešką, taip pat kad juos būtų galima išversti mašininiu būdu. Praėjusiais metais bendradarbiaujant su paveldo institucijomis visoje Europoje (Vokietijoje, Italijoje, Belgijoje, Austrijoje, Rumunijoje) buvo surengti penki transkribavimo maratonai ir perrašyta beveik 3 000 su Pirmuoju pasauliniu karu susijusių dokumentų.
Sužinokite daugiau
Sužinokite daugiau apie mūsų automatinį papildymą arba Europos Sąjungos „eTranslation“ veiklą.
Jei jus domina išsami informacija apie „Europeanos“ leidybos sistemos kalbinį elementą, taip pat galite susipažinti su „Europeanos“ leidybos vadovu, kuriame tiksliai nurodyta, ko reikia teikiant duomenis „Europeanai“.
„EuropeanaTech“ dėjo pastangas daugiakalbystės srityje, žr., pavyzdžiui, geriausios daugiakalbės prieigos praktikos pavyzdžius ir įvairius pranešimus apie kalbų klausimų sprendimą paskutinėje „EuropeanaTech“ konferencijoje.
Prisijunkite prie „Transcribathon.eu“ ir padėkite padaryti „Europeaną“ daugiakalbiškesnę. Čia rasite pamokų anglų, prancūzų ir vokiečių kalbomis, taip pat informacijos apie kitus mūsų renginius.
