Europeana Tõlgi
Euroopa ühendamise rahastu eTranslationi telekommunikatsiooniprojekti Europeana Translate eesmärk on tugevdada sidemeid eTranslationi taristu ja Europeana algatuse raames kasutusele võetud kultuuripärandi ühise Euroopa andmeruumi vahel, et tuua kasu mõlemale. Ühest küljest on projekti eesmärk parandada kultuuripärandi ressursside kasutatavust, rikastades kultuuripärandi andmekogumeid mitmekeelsete metaandmetega. Teisest küljest suurendab see Euroopa keeleressursside koordineerimise kaudu avalikult kättesaadavaks tehtud keeleressursse miljonite kultuuripärandi objektide metaandmetega, mis valiti hoolikalt välja, puhastati ja normaliseeriti, et neid saaks kasutada koolituse eesmärgil.
Selleks on Europeana Translate välja töötanud ja kasutusele võtnud masintõlkevahendid, mis on kohandatud kultuuripärandi sektori vajadustele. Vahendeid kasutatakse praegu Europeana taristu kaudu kättesaadava enam kui 25 miljoni kirje metaandmete tõlkimiseks 22 ELi ametlikust keelest inglise keelde, parandades kasutajatele pakutavat mitmekeelset kogemust.
Projekti käigus koolitasid partnerid partner Pangeanicu pakutavaid tõlkemootoreid, mis sisaldasid valikut Europeana taristust valitud metaandmetest, sealhulgas kakskeelseid ja ühekeelseid andmeid ning mitmekeelseid sõnastikke. OPUSe kogu veebisaidilt valitud lisaandmeid kaaluti ka keelte puhul, mis ei olnud piisavalt esindatud. Tehti mitmeid katseid, et otsustada, milline on parim kombinatsioon koolitusandmetest ja mootorite seadistamisest iga keele jaoks. Jagades andmed koolitus- ja testimiskomplektide vahel, viidi kõigi keelepaaride puhul läbi standardmõõdikutel (nt BLEU ja TER) põhinev automaatne hindamine. Tulemused näitavad enamiku keelte puhul märkimisväärset paranemist võrreldes üldiste Pangeanic-mudelitega (enne valdkonnasisest koolitust) ja eTranslationi DSI-ga.
Automaattõlke hindamine inimekspertide poolt
Automaattõlkeid hindasid põhjalikult ka lingvistid ja kultuuripärandi eksperdid. Hindajatel paluti hinnata automaattõlget inglise keelde skaalal 0–100, võttes arvesse selliseid aspekte nagu sujuvus (grammatika õigsus), täpsus (üldtähendus) ja adekvaatsus (terminoloogia nõuetekohane kasutamine). Neil paluti anda ka täiendavat tagasisidet, sealhulgas teatada olulistest ja korduvatest vigadest. Kultuuripärandi sektori liikmete kaasamiseks korraldati platvormi CrowdHeritage kaudu kolm rahvahankekampaaniat. Kokku osales neis 44 ekspert-lingvisti ja 29 kultuuripärandi spetsialisti, kes andsid enamiku 22 keele puhul üsna kõrge hinnangu (üle 80 %).
Inimhindamisel saadud tulemused andsid meile ülevaate masintõlkemootorite käitumisest eri keeltes. Inimestelt saadud hinnangute põhjalik statistiline analüüs koos masintõlkemootorite arvutatud automaatsete usalduspunktidega võimaldas meil kindlaks määrata asjakohased kvaliteedikünnised eri keeltest Europeana infrastruktuuri tehtud tõlgete avaldamiseks.
Kasu kasutajatele ja kultuuripärandiasutustele
Europeana taristu kasutab tõlkemootoreid metaandmete automaatsete ingliskeelsete tõlgete koostamiseks, indekseerimiseks, jagamiseks ja kuvamiseks, mis võimaldab inimestel materjali paremini avastada, analüüsida ja taaskasutada.
Selle töö positiivset mõju on kinnitanud mõju hindamise uuring, mille viisid läbi 27 keeleteadlast ja 18 kultuuripärandi eksperti. Kui küsiti, millist lisaväärtust võivad automaatsed ingliskeelsed tõlked anda kultuuripärandi objektide otsimisele ja kuvamisele Europeana veebisaidil, pidasid mõlemad kogukonnad seda oluliseks. Samuti teatasid nad, et nad hindavad eeldatavalt suuremat otsingutulemuste hulka, mis hõlmaks kultuuripärandi esemeid, mida praegu inglise keeles otsides ei tagastata: 83,4 % ja 62,9 % kultuuripärandi ekspertidest ja keeleteadlastest pidasid seda paranemist väärtuslikuks.
Lisaks võivad projekti raames loodud tõlkemootorid olla kasulikud andmeesitajatele, kes soovivad tõlkida oma kogude metaandmed inglise keelde, parandades nende kogude juurdepääsetavust. MINTi agregeerimisplatvormi kasutajad saavad otseselt kasutada olemasolevat rakendusliidest, mis on seotud mootoritega, samas kui tehnilise oskusteabega kultuuripärandiasutused saavad kasutada hõlpsasti kasutatavaid masintõlkemootoreid, mis on tehtud avalikult kättesaadavaks ELGi hoidlas. Kõik uuringus osalenud kultuuripärandi eksperdid teatasid, et nad kaaluvad Europeana tõlkevahendite kasutamist, et rikastada oma organisatsiooni kogusid automaatsete tõlgetega, et parandada leitavust.
Europeana tõlkeüritus - kuidas masintõlge & mitmekeelne juurdepääs mõjutab kultuuripärandit
Kas soovite rohkem teada saada Europeana Translate projekti, selle metoodika ja tulemuste kohta? Kas soovite ka süvendada oma teadmisi tipptasemel masintõlketehnoloogiatest ja sellest, kuidas neid kultuuripärandisektoris rakendada?
Seejärel osalege üritusel Europeana Translate Event – How machine translation & mitmekeelne juurdepääs mõjutab kultuuripärandit. See on veebiüritus, mis toimub 13. aprillil 2023 kell 14.00–17.00 Kesk-Euroopa aja järgi. Te kuulete, kuidas projektipartnerid selgitavad üksikasjalikult nende kahe aasta töö metoodikat ja tulemusi. Samuti arutatakse sarnaseid projekte, võttes alati kriitiliselt arvesse kultuuripärandi andmete/metaandmete automatiseeritud tõlkimise tähtsust ning arutledes tehisintellekti tehnoloogia edasiste sammude, kasutatavuse ja probleemide üle kultuuripärandisektoris.
