Marco Rendina: Kun je uitleggen wat een CAT-tool is?
Ma Ángeles García: Tuurlijk! Een CAT Tool - afkorting voor Computer-Assisted Translation Tool - wordt gebruikt om vertalingen op te slaan en op te halen wanneer deze door een vertaaldienst worden geleverd. Een CAT-tool vergemakkelijkt het vertaalproces door de tekst in kleinere, vertaalbare segmenten te verdelen en deze segmenten zo in te delen dat de vertaler ze gemakkelijker effectief kan beheren. Dit maakt het vertaalproces tijdbesparend.
De segmenten kunnen later worden opgehaald, zodat de vertaler zich aan de oorspronkelijke terminologie en schrijfstijl houdt. Deze tool biedt overeenkomsten voor materiaal dat vergelijkbaar is met eerder vertaalde inhoud, waardoor fouten verder worden verminderd door de vertaalde segmenten naast de bronzinnen op te slaan. De vertaler heeft op elk moment eenvoudig toegang tot elk vertaald segment om een nauwkeurige vertaling te garanderen.
Computerondersteunde vertaaltools werden ontwikkeld om vertalers in staat te stellen snel tekstsegmenten te zoeken en aan te passen als dat nodig is. Deze tools helpen ook bij tijdige revisie.
Zo zijn de zinnen “de kat is dik” en “de kat is zwart” voor 75 % vergelijkbaar. Als onze databank weet hoe “de kat is dik” moet worden vertaald, zal zij deze vertaling voorstellen, waarbij de menselijke vertaler alleen “vet” in “zwart” moet veranderen.
MR: Waarom zou een professional op het gebied van cultureel erfgoed een CAT-tool moeten gebruiken?
MAG: Wanneer professionals op het gebied van cultureel erfgoed tekstuele gegevens moeten uploaden naar Europeana.eu, kunnen zij een CAT-tool gebruiken om de inhoud op een snelle en efficiënte manier te herzien. Zij kunnen hun eigen vertaalgeheugens bouwen en eerder vertaald materiaal “recyclen”. Bij het publiceren van vergelijkbare inhoud kan een computerondersteund vertaalhulpmiddel helpen om betrouwbare en consistente vertalingen te verkrijgen. Het CAT-instrument van Pangeanic, PECAT genaamd, biedt een reeks voordelen: tijdbesparend, foutreductie, consistentie en het vermogen om met complexe terminologie om te gaan.
MR: Kunt u uitleggen hoe PECAT dat bereikt?
MAG: Natuurlijk! PECAT splitst de te vertalen tekst op in segmenten, die zinnen, alinea's of enkele woorden kunnen zijn. Deze segmenten worden op een handige manier gepresenteerd, waardoor vertalen eenvoudiger en sneller wordt. De vertaling van elk segment wordt naast de oorspronkelijke tekst opgeslagen en beide worden in het databasesysteem opgeslagen als een vertaaleenheid (TU).
PECAT biedt functies voor kwaliteitscontrole om de consistentie en nauwkeurigheid van de vertaling te garanderen. Bij het bewerken van machinevertalingen is het inschatten van de kwaliteit van de vertaling van cruciaal belang. PECAT biedt een betrouwbaarheidsscore voor elke vertaaleenheid, zodat gebruikers prioriteit kunnen geven aan het bewerken van eenheden met een lagere score of zich kunnen concentreren op eenheden met een hogere score, terwijl de rest wordt afgewezen.
Bovendien stelt PECAT gebruikers in staat vertaaleenheden te accepteren of te weigeren. Dit is vooral handig wanneer niet-semantische tekst, zoals code of symbolen, ten onrechte wordt opgenomen in de tekst die moet worden bewerkt. Gebruikers kunnen deze segmenten gewoon afwijzen om ze te verwijderen.
MR: Wat maakt PECAT nuttig voor instellingen voor cultureel erfgoed en hoe is het afgestemd op hun behoeften?
MAG: In de loop van het AI4Culture-project is het PECAT-instrument van Pangeanic aangepast om tegemoet te komen aan de behoeften van de gemeenschap van cultureel erfgoed. De resulterende versie van PECAT zal worden uitgebracht als een open-source tool en gratis online service, waardoor instellingen voor cultureel erfgoed kunnen profiteren van verschillende unieke functionaliteiten. Het is een veelzijdig hulpmiddel dat gebruik maakt van zowel machine- als menselijke expertise om vertalingen van hoge kwaliteit te garanderen, waardoor het ideaal is voor het beheren van complexe vertaaltaken in instellingen voor cultureel erfgoed. Het verbetert zowel individuele als collaboratieve vertaalprojecten door efficiënte workflowcontrole, aanpassingsvermogen aan gebruikersbehoeften en gebruiksgemak te bieden zonder technische expertise te vereisen. PECAT biedt ook functies zoals naast elkaar geplaatste tekstweergave, een veilige werkomgeving en geavanceerde filtering van vertaalsegmenten op basis van hun validatiestatus of betrouwbaarheidsscore.
Bovendien zijn de instrumenten uitgebreid met gespecialiseerde functionaliteiten, die de efficiënte verwerking van metagegevens over cultureel erfgoed volgens het Europeana-gegevensmodel ondersteunen. Daartoe is PECAT verbonden met de machinevertalingsengines van EuropeanaTranslate, die zijn afgestemd op metadata van Europeana.eu en de vertaling van alle Europese talen naar het Engels ondersteunen. PECAT is ook verbonden met de MINT-metagegevensaggregatietool, die door veel instellingen voor cultureel erfgoed en aggregators wordt gebruikt. Dit ondersteunt een vlotte gegevensuitwisseling tussen de instrumenten en de nauwkeurige verwerking en verzending van vertalingen voordat ze op Europeana.eu worden gepubliceerd.
MR: Heel erg bedankt voor het inzicht! We kunnen niet wachten om het te testen - wanneer zal het beschikbaar zijn?
MAG: Zoals ik eerder al zei, brengen we in het kader van het AI4Culture-project een open-sourceversie van PECAT uit. Deze versie kan vrij worden gebruikt door instellingen voor cultureel erfgoed voor hun metagegevensvertalingstaken. Deze versie zal vanaf september 2024 beschikbaar zijn op het AI4Culture-platform.
Meer informatie
Zoals Ma Ángeles García vermeldt, zal het AI4Culture-project in september 2024 een platform lanceren waar open instrumenten online beschikbaar zullen worden gesteld, samen met bijbehorende documentatie en opleidingsmateriaal. Houd de projectpagina op Europeana Pro in de gaten voor meer details en blijf op de hoogte van het project LinkedIn en X account!
