Kuidas me töötame selle nimel, et kultuur oleks kõigi jaoks ja mis tahes keeles

Avaldatud 27. september 2019 poolt

Beth Daley (Europeana Foundation)

Alates 2015. aasta jaanuarist on Europeana üks Euroopa Liidu digiteenuste taristutest. ELis on neid mitu, teiste hulgas lastele turvalisem internet, elektroonilised tervishoiuteenused ja ärijuhtimine. Europeana DSI tutvustab ja pakub Europeana kogude platvormi kaudu veebipõhist juurdepääsu Euroopa kultuuri- ja teaduspärandile ning toetab kultuuripärandiasutusi digiajastuga kohanemisel.

Eelmisel aastal avaldas Euroopa Komisjon Europeana hinnangu, milles kirjeldati meie saavutusi ja mõningaid valdkondi, millele keskenduda. Selles sarjas vaatleme mõningaid Europeana DSI tegevusi, mida hindamine pidas prioriteetseks, andes teile parema ülevaate püüdlustest ja probleemidest, millega me praegu tegeleme.

Keel, mida te räägite, ei tohiks takistada Europeana kollektsioonidest soovitud sisu leidmist, kuid praegu võib see nii olla. Uurige, mida me selle parandamiseks teeme.

Europeana kogud sisaldavad materjale galeriidest, raamatukogudest, arhiividest ja muuseumidest kõigis 28 ELi liikmesriigis ja mujal. Veebisaidil saab navigeerida 27 keeles ja oma emakeeles kirjeldatud elemente on lihtne otsida. Kuid asjad muutuvad keerulisemaks, kui soovite näha üksusi, mis vastavad teie otsingule, kuid mida kirjeldatakse teises keeles.

Kokku kasutatakse kogude kirjeldamiseks 37 keelt. Kuid üle poole kogu materjalist (57%) kasutab ühte vaid viiest keelest - inglise, saksa, hollandi, norra või prantsuse keelt.

Ühes keeles kirjeldatud elemendi ilmumine tulemustesse või nendega seotud materjali, kui seda otsitakse teises keeles, ei ole lihtne. Teame, et meil on veel pikk tee minna, kuid positiivsete muutuste tegemine selles valdkonnas on üks meie prioriteete.

Meie eesmärk

Soovime, et inimesed leiaksid selle, mida nad otsivad, isegi kui nad ei kasuta keelt, milles nende sihtobjekt on kirjeldatud.

Soovime suurendada tõenäosust, et millegi otsimine ühes keeles toob tulemusi, mis vastavad teie kriteeriumidele teises keeles.

Väljakutsed

Automaatne tõlkimine paraneb, kuid see ei ole lollikindel, nagu olete näinud, kui olete kunagi kasutanud sellist veebivahendit nagu Google Translate. Europeana kollektsioonide puhul on lisandunud komplikatsioone. Me ei keskendu ühele konkreetsele keelele, mida teise keelde tõlgitakse. Töötame 37 keeles kirjeldatud kogudega ja püüame neid sobitada, et otsida termineid, mis võivad tulla mis tahes keeles. Lisaks ei sarnane metaandmed loomuliku keelega, millel on täislaused ja prognoositav grammatika; see on sageli esitatud lühikeste fraaside või isegi üksikute sõnadega, mis tähendab, et täpse tõlke jaoks vajalikku konteksti on raske leida. Keerukust lisab asjaolu, et kasutatavad terminid võivad olla väga spetsiifilised - need võivad tunduda tavalise terminina, kuid neil on erinev tähendus, kui neid kasutatakse digitaalse kultuurimaterjali kirjeldamise kontekstis.

Automatiseeritud protsessid saavad toimida ainult siis, kui neile antakse õiget ja asjakohast teavet. See tundub ilmselge, kuid nagu me nägime selle sarja varasemates postitustes, on Europeanale esitatav teave oma sügavuse ja kvaliteedi poolest väga erinev.

Selleks, et midagi tõlkida, peame teadma, millises keeles algne element on esitatud. Meie süsteemid ei arva ära. Nii et iga element (nagu pealkiri ja kirjeldus) vajab keele markerit. See on veel üks teabekiht, mida kultuuripärandiasutused peavad andma.

Mida me teeme

Uued uuendused

Sel aastal vaatasime läbi oma kvaliteedistandardi Europeana Publishing Framework, et lisada metaandmete standardid lisaks olemasolevatele sisustandarditele. Nüüd julgustab see metaandmetega töötavaid inimesi tõlkima selliseid elemente nagu pealkirjad mitmesse keelde ja lisama kontekstipõhiseid kohanimesid, mis on ise mitmekeelsed, kontekstipõhistest sõnastikest (vt punkt allpool). Raamistikus julgustatakse kasutama ka neid üliolulisi keelemärke, et näidata, millist keelt kasutatakse. See võtab ära oletuse ja tähendab, et saab rakendada automaatsemaid linkimis- ja tõlkeprotsesse.
Lisaks Europeana Sihtasutuse ja Võrgustiku Assotsiatsiooni ekspertteadmiste kasutamisele toetume ka teiste tööle, et parandada Europeana kollektsioonide mitmekeelsust. Eelmisel aastal viisime koos eTranslationi meeskonnaga läbi katseprojekti, mis on veel üks Euroopa Liidu rahastatud DSI projekt. Tugineme nüüd sellele katseprojektile edasiste eksperimenteerimistegevustega, et kasutada ära projekti automaatse tõlkimise potentsiaali Europeana jaoks.

Käimasolevad tegevused

Kui fraasile on antud õige kontekst, on seda palju lihtsam tõlkida. Jätkame metaandmete rikastamist, et pakkuda Europeana kogudest leitavale materjalile rohkem konteksti. Meie jõupingutused hõlmavad kontekstipõhiste sõnastike kasutamist, eelkõige neid, mis on kättesaadavad lingitud avatud andmetena. Need andmekogumid annavad meile täiendavaid üksikasju, nagu mitmekeelsed sildid, põhimõistete tõlked või inimeste ja kohtade nimede erinevad variandid. See lihtsustab Europeana kollektsioonidest esemete otsimist ja leidmist. Sõnastikke võivad kasutada kas andmepakkujad või Europeana osana mitmesugustest (pool)automaatsetest metaandmete rikastamise protsessidest.
Euroopa on mitmekeelne. Me peame ka olema. Täname oma partnereid ja sõpru selle eest, et nad aitasid meil tõlkida olulisi elemente, nagu Europeana avaldamisraamistik ja õiguste deklaratsioonid, mida Europeana kasutab (teave, mis ütleb teile, mida saate teha Europeanast leitud elemendiga, nt kas see on autoriõigusega kaitstud või üldkasutatav?), rohkematesse keeltesse. Seni on õiguste deklaratsioonidel seitse tõlget ja veel kuus on teel.
Europeana kogude veebisait on kättesaadav 27 keeles ja sel aastal avaldasime uue näituse „Riskipärand“ seitsmes keeles.

Millele tähelepanu pöörata...

Europeana mitmekeelsemaks muutmine on käesoleva aasta oktoobris Soome eesistumise ajal toimuva kahepäevase ürituse prioriteet ja teema. Üritusel keskenduvad Europeana fond ning Soome haridus- ja kultuuriministeerium vajadustele, ootustele ja edasisele mitmekeelsusele digitaalses kultuuripärandis.
Sa võid ka aidata. Koos partneritega korraldame üritusi „Transcribathon“, mis kutsuvad kõiki osalema (kas kodus veebis või füüsilisel üritusel), ning trükime üles sageli käsitsi kirjutatud tekstidokumentide sisu, et neid oleks seejärel lihtsam juurde pääseda ja otsida ning et neid oleks võimalik masintõlke abil tõlkida. Eelmisel aastal korraldati koostöös muinsuskaitseasutustega kogu Euroopas (Saksamaa, Itaalia, Belgia, Austria, Rumeenia) viis transkribeerimist ning kirjutati üles peaaegu 3000 Esimese maailmasõjaga seotud dokumenti.

Uuri lähemalt

Lisateave meie automaatse rikastamise või Euroopa Liidu eTranslationi tegevuse kohta.

Kui olete huvitatud Europeana avaldamisraamistiku keeleelemendi täpsetest üksikasjadest, võite tutvuda ka Europeana avaldamisjuhendiga, milles on täpselt kirjeldatud, mida on vaja andmete esitamisel Europeanale.

EuropeanaTech on teinud jõupingutusi mitmekeelsuse valdkonnas, vt näiteks mitmekeelse juurdepääsu parimad tavad ja viimasel EuropeanaTechi konverentsil tehtud mitmesugused ettekanded keeleküsimuste lahendamise kohta.

Aidata kaasa Europeana mitmekeelsemaks muutmisele, ühinedes veebisaidil Transcribathon.eu. Siit leiate juhiseid, mis aitavad teil alustada inglise, prantsuse ja saksa keeles, ning teavet meie järgmiste ürituste kohta.

Kuidas me töötame selle nimel, et kultuur oleks kõigi jaoks ja mis tahes keeles

Jaga

Meie eesmärk

Väljakutsed

Mida me teeme

Uuri lähemalt

Avasta seotud sisu