Marco Rendina: Kas oskate selgitada, mis on CAT-vahend?
Ma Ángeles García: Muidugi! CAT-tööriista, mis on lühend arvutipõhisest tõlketööriistast, kasutatakse tõlgete salvestamiseks ja allalaadimiseks, kui neid pakub tõlketeenistus. CAT-vahend hõlbustab tõlkeprotsessi, jagades teksti väiksemateks, tõlgitavateks segmentideks ja korraldades need segmendid viisil, mis lihtsustab tõlkijal nende tõhusat haldamist. See muudab tõlkeprotsessi ajaliselt efektiivseks.
Segmendid on võimalik leida hiljem, tagades, et tõlkija järgib algset terminoloogiat ja kirjutamisstiili. See tööriist pakub vasteid varem tõlgitud sisuga sarnasele materjalile, vähendades veelgi vigu, salvestades tõlgitud segmendid lähtefraaside kõrvale. Tõlkija pääseb igal ajal hõlpsalt juurde mis tahes tõlgitud segmendile, et tagada täpne tõlge.
Töötati välja arvutipõhised tõlkevahendid, et tõlkijad saaksid vajaduse korral kiiresti tekstisegmente otsida ja muuta. Need vahendid aitavad kaasa ka õigeaegsele läbivaatamisele.
Näiteks laused „kass on paks“ ja „kass on must“ on 75 % sarnased. Kui meie andmebaas teab, kuidas tõlkida sõna „kass on paks“, soovitab ta seda tõlget, nõudes, et inimtõlkija muudaks ainult sõna „rasvane“ sõnaks „must“.
MR: Miks peaks kultuuripärandi spetsialist kasutama CAT-vahendit?
MAG: Kui kultuuripärandi spetsialistid peavad Europeana.eu portaali üles laadima tekstilisi andmeid, saavad nad sisu kiireks ja tõhusaks läbivaatamiseks kasutada CAT-vahendit. Nad saavad luua oma tõlkemälud ja võtta ringlusse varem tõlgitud materjali. Sarnase sisu avaldamisel võib arvutipõhine tõlkevahend aidata saada usaldusväärseid ja järjepidevaid tõlkeid. Pangenicu CAT-vahend PECAT pakub mitmeid eeliseid: aja kokkuhoid, vigade vähendamine, järjepidevus ja võime kasutada keerulist terminoloogiat.
MR: Kas saate selgitada, kuidas PECAT seda saavutab?
MAG: Loomulikult! PECAT jagab tõlgitava teksti segmentideks, mis võivad olla laused, lõigud või üksikud sõnad. Need segmendid on esitatud mugaval viisil, muutes tõlkimise lihtsamaks ja kiiremaks. Iga segmendi tõlge salvestatakse koos originaaltekstiga ja mõlemad salvestatakse andmebaasisüsteemis tõlkeüksusena (TU).
PECAT pakub kvaliteedikontrolli funktsioone, et tagada tõlke järjepidevus ja täpsus. Masintõlgete toimetamisel on oluline hinnata tõlke kvaliteeti. PECAT annab igale tõlkeüksusele usaldusskoori, mis võimaldab kasutajatel eelistada madalama punktisummaga üksuste redigeerimist või keskenduda kõrgema punktisummaga üksustele, lükates samal ajal ülejäänud tagasi.
Lisaks võimaldab PECAT kasutajatel tõlkeüksusi vastu võtta või tagasi lükata. See on eriti kasulik, kui mittesemantiline tekst, näiteks kood või sümbolid, lisatakse ekslikult redigeeritavasse teksti. Kasutajad saavad need segmendid lihtsalt eemaldada.
MR: Mis muudab PECATi kultuuripärandiasutuste jaoks kasulikuks ja kuidas on see kohandatud nende vajadustele?
MAG: Projekti AI4Culture käigus kohandati Pangenicu vahendit PECAT, et see vastaks kultuuripärandi kogukonna vajadustele. Saadud PECATi versioon avaldatakse avatud lähtekoodiga vahendina ja tasuta veebiteenusena, mis võimaldab kultuuripärandiasutustel kasutada mitut ainulaadset funktsiooni. See on mitmekülgne tööriist, mis kasutab nii masin- kui ka inimteadmisi, et tagada kvaliteetsed tõlked, muutes selle ideaalseks keerukate tõlkeülesannete haldamiseks kultuuripärandi kontekstis. See täiustab nii individuaalseid kui ka koostööpõhiseid tõlkeprojekte, pakkudes tõhusat töövoo juhtimist, kohandatavust kasutajate vajadustele ja kasutusmugavust ilma tehnilisi teadmisi nõudmata. PECAT pakub ka selliseid funktsioone nagu kõrvuti teksti kuvamine, turvaline töökeskkond ja tõlkesegmentide täiustatud filtreerimine vastavalt nende valideerimisolekule või usaldusväärsuse skoorile.
Lisaks on vahendeid laiendatud erifunktsioonidega, mis toetavad Europeana andmemudelit järgivate kultuuripärandi metaandmete kirjete tõhusat käitlemist. Selleks on PECAT ühendatud EuropeanaTranslate masintõlkemootoritega, mida on täiustatud Europeana.eu metaandmete põhjal ja mis toetavad tõlkimist kõigist Euroopa keeltest inglise keelde. PECAT on ühendatud ka MINT metaandmete koondamise vahendiga, mida kasutavad paljud kultuuripärandiasutused ja agregaatorid. See toetab sujuvat andmevahetust vahendite vahel ning tõlgete täpset töötlemist ja edastamist enne nende avaldamist veebisaidil Europeana.eu.
MR: Suur tänu ülevaate eest! Me ei saa oodata, et seda testida - millal see on saadaval?
MAG: Nagu ma eespool mainisin, avaldame projekti AI4Culture raames PECATi avatud lähtekoodiga versiooni. Kultuuripärandiasutused saavad seda versiooni metaandmete tõlkimiseks vabalt kasutada. See versioon on platvormil AI4Culture kättesaadav alates 2024. aasta septembrist.
Uuri lähemalt
Nagu Ma Ángeles García mainib, käivitatakse projektiga AI4Culture 2024. aasta septembris platvorm, kus tehakse veebis kättesaadavaks avatud vahendid koos nendega seotud dokumentide ja koolitusmaterjalidega. Lisateabe saamiseks jälgige Europeana Pro projekti lehekülge ja jälgige projekti LinkedIn ja X kontot!
