Marco Rendina: Kan du forklare, hvad et CAT-værktøj er?
Ma Ángeles García: Det er helt sikkert! Et CAT-værktøj - en forkortelse for Computer-Assisted Translation Tool - bruges til at gemme og hente oversættelser, når de leveres af en oversættelsestjeneste. Et CAT-værktøj letter oversættelsesprocessen ved at opdele teksten i mindre segmenter, der kan oversættes, og organisere disse segmenter på en måde, der gør det lettere for oversætteren at styre dem effektivt. Dette gør oversættelsesprocessen tidseffektiv.
Segmenterne kan hentes senere, hvilket sikrer, at oversætteren overholder den oprindelige terminologi og skrivestil. Dette værktøj giver match til materiale, der ligner tidligere oversat indhold, hvilket yderligere reducerer fejl ved at gemme de oversatte segmenter sammen med kildesætningerne. Oversætteren kan nemt få adgang til et hvilket som helst oversat segment til enhver tid for at sikre en nøjagtig oversættelse.
Computerstøttede oversættelsesværktøjer blev udviklet for at give oversættere mulighed for hurtigt at søge efter og ændre tekstsegmenter efter behov. Disse værktøjer hjælper også med rettidig revision.
Sætningerne "katten er fed" og "katten er sort" svarer f.eks. til 75 %. Hvis vores database ved, hvordan man oversætter "katten er fed", vil den foreslå denne oversættelse, hvilket kræver, at den menneskelige oversætter kun ændrer "fedt" til "sort".
MR: Hvorfor skal en kulturarvsprofessionel bruge et CAT-værktøj?
MAG: Når fagfolk inden for kulturarv har brug for at uploade tekstdata til Europeana.eu, kan de bruge et CAT-værktøj til at revidere indholdet på en hurtig og effektiv måde. De kan opbygge deres egne oversættelseshukommelser og "genanvende" tidligere oversat materiale. Ved udgivelse af lignende indhold kan et computerassisteret oversættelsesværktøj hjælpe med at opnå pålidelige og konsistente oversættelser. Pangeanic's CAT-værktøj, kaldet PECAT, giver en række fordele: tidsbesparende, fejlreduktion, konsistens og evnen til at håndtere kompleks terminologi.
MR: Kan du forklare, hvordan PECAT opnår dette?
MAG: Selvfølgelig! PECAT opdeler den tekst, der skal oversættes, i segmenter, som kan være sætninger, afsnit eller enkelte ord. Disse segmenter præsenteres på en bekvem måde, hvilket gør oversættelsen nemmere og hurtigere. Hvert segments oversættelse gemmes sammen med den oprindelige tekst, og begge gemmes i databasesystemet som en oversættelsesenhed (TU).
PECAT tilbyder kvalitetskontrolfunktioner for at sikre oversættelseskonsistens og -nøjagtighed. Når du redigerer maskinoversættelser, er det afgørende at vurdere kvaliteten af oversættelsen. PECAT giver en tillidsscore for hver oversættelsesenhed, så brugerne kan prioritere redigering af enheder med lavere score eller fokusere på enheder med højere score, mens de afviser resten.
Derudover giver PECAT brugerne mulighed for at acceptere eller afvise oversættelsesenheder. Dette er især nyttigt, når ikke-semantisk tekst, f.eks. kode eller symboler, fejlagtigt medtages i den tekst, der skal redigeres. Brugere kan simpelthen afvise disse segmenter for at fjerne dem.
MR: Hvad gør PECAT nyttigt for kulturarvsinstitutioner, og hvordan er det blevet skræddersyet til at opfylde deres behov?
MAG: I løbet af AI4Culture-projektet er Pangeanic's PECAT-værktøj blevet tilpasset for at imødekomme kulturarvssamfundets behov. Den resulterende version af PECAT vil blive frigivet som et open source-værktøj og gratis onlinetjeneste, der gør det muligt for kulturarvsinstitutioner at drage fordel af flere unikke funktionaliteter. Det er et alsidigt værktøj, der udnytter både maskinel og menneskelig ekspertise til at sikre oversættelser af høj kvalitet, hvilket gør det ideelt til at håndtere komplekse oversættelsesopgaver i kulturarvsmiljøer. Det forbedrer både individuelle og samarbejdsbaserede oversættelsesprojekter ved at tilbyde effektiv styring af arbejdsgangen, tilpasningsevne til brugernes behov og brugervenlighed uden at kræve teknisk ekspertise. PECAT tilbyder også funktioner som side om side tekstvisning, et sikkert arbejdsmiljø og avanceret filtrering af segmenter af oversættelse i henhold til deres valideringsstatus eller tillidsscore.
Desuden er værktøjerne blevet udvidet med specialiserede funktioner, som understøtter en effektiv håndtering af kulturarvsmetadataposter, der følger Europeana-datamodellen. Med henblik herpå er PECAT forbundet med EuropeanaTranslate-maskineoversættelsesmaskinerne, som er blevet finjusteret på metadata fra Europeana.eu og understøtter oversættelsen fra alle europæiske sprog til engelsk. PECAT er også blevet forbundet med MINT-metadataaggregeringsværktøjet, som anvendes af mange kulturarvsinstitutioner og -aggregatorer. Dette understøtter en gnidningsløs dataudveksling mellem værktøjerne og en nøjagtig behandling og overførsel af oversættelser, inden de offentliggøres på Europeana.eu.
MR: Tusind tak for indsigten! Vi kan ikke vente med at teste det - hvornår bliver det tilgængeligt?
MAG: Som jeg nævnte før, frigiver vi inden for rammerne af AI4Culture-projektet en open source-version af PECAT. Denne version kan frit anvendes af kulturarvsinstitutioner til deres metadataoversættelsesopgaver. Denne version vil være tilgængelig på AI4Culture-platformen fra september 2024.
Læs mere
Som Ma Ángeles García nævner, vil AI4Culture-projektet i september 2024 lancere en platform, hvor åbne værktøjer vil blive gjort tilgængelige online sammen med tilhørende dokumentation og undervisningsmateriale. Hold øje med projektsiden på Europeana Pro for flere detaljer og hold øje med projektet LinkedIn og X konto!
