Marco Rendina: Kan du förklara vad ett CAT-verktyg är?
Ma Ángeles García: Visst är det så! Ett CAT-verktyg - förkortning för Computer-Assisted Translation Tool - används för att lagra och hämta översättningar när de tillhandahålls av en översättningstjänst. Ett CAT-verktyg underlättar översättningsprocessen genom att dela upp texten i mindre, översättningsbara segment och organisera dessa segment på ett sätt som gör det lättare för översättaren att hantera dem effektivt. Detta gör översättningsprocessen tidseffektiv.
Segmenten kan hämtas senare, vilket säkerställer att översättaren följer den ursprungliga terminologin och skrivstilen. Det här verktyget ger matchningar för material som liknar tidigare översatt innehåll, vilket ytterligare minskar felen genom att spara de översatta segmenten tillsammans med källfraserna. Översättaren kan enkelt komma åt alla översatta segment när som helst för att säkerställa korrekt översättning.
Datorstödda översättningsverktyg utvecklades för att göra det möjligt för översättare att snabbt söka och ändra textsegment efter behov. Dessa verktyg bidrar också till en snabb översyn.
Meningarna ”katten är fet” och ”katten är svart” är till exempel 75 % likartade. Om vår databas vet hur man översätter ”katten är fet” kommer den att föreslå denna översättning, vilket kräver att den mänskliga översättaren endast ändrar ”fett” till ”svart”.
MR: Varför ska en kulturarvsprofessor använda ett CAT-verktyg?
MAG: När yrkesverksamma inom kulturarvet behöver ladda upp textdata till Europeana.eu kan de använda ett CAT-verktyg för att se över innehållet på ett snabbt och effektivt sätt. De kan bygga upp egna översättningsminnen och ”återanvända” tidigare översatt material. När du publicerar liknande innehåll kan ett datorstödt översättningsverktyg hjälpa dig att få tillförlitliga och konsekventa översättningar. Pangeanics CAT-verktyg, kallat PECAT, har en rad fördelar: tidsbesparande, felreducering, konsekvens och förmåga att hantera komplex terminologi.
MR: Kan du förklara hur PECAT uppnår detta?
MAG: Självklart! PECAT bryter ner texten som ska översättas till segment, vilket kan vara meningar, stycken eller enstaka ord. Dessa segment presenteras på ett bekvämt sätt, vilket gör översättningen enklare och snabbare. Varje segments översättning sparas tillsammans med originaltexten och båda lagras i databassystemet som en översättningsenhet (TU).
PECAT erbjuder funktioner för kvalitetskontroll för att säkerställa konsekvent och korrekt översättning. Vid redigering av maskinöversättningar är det viktigt att uppskatta kvaliteten på översättningen. PECAT ger en förtroendepoäng för varje översättningsenhet, så att användarna kan prioritera redigering av enheter med lägre poäng eller fokusera på enheter med högre poäng medan de avvisar resten.
Dessutom gör PECAT det möjligt för användare att acceptera eller avvisa översättningsenheter. Detta är särskilt användbart när icke-semantisk text, till exempel kod eller symboler, felaktigt ingår i den text som ska redigeras. Användare kan helt enkelt avvisa dessa segment för att ta bort dem.
MR: Vad gör PECAT användbart för kulturarvsinstitutioner, och hur har det skräddarsytts för att tillgodose deras behov?
MAG: Inom ramen för AI4Culture-projektet har Pangeanics PECAT-verktyg anpassats för att tillgodose kulturarvssamhällets behov. Den resulterande versionen av PECAT kommer att släppas som ett verktyg med öppen källkod och gratis onlinetjänst, vilket gör det möjligt för kulturarvsinstitutioner att dra nytta av flera unika funktioner. Det är ett mångsidigt verktyg som utnyttjar både maskinell och mänsklig expertis för att säkerställa översättningar av hög kvalitet, vilket gör det idealiskt för att hantera komplexa översättningsuppgifter i kulturarvsmiljöer. Det förbättrar både enskilda och samarbetande översättningsprojekt genom att erbjuda effektiv arbetsflödeskontroll, anpassningsförmåga till användarnas behov och användarvänlighet utan att kräva teknisk expertis. PECAT erbjuder också funktioner som textvisning sida vid sida, en säker arbetsmiljö och avancerad filtrering av översättningssegment enligt deras valideringsstatus eller konfidenspoäng.
Dessutom har verktygen utökats med specialiserade funktioner som stöder en effektiv hantering av metadataposter för kulturarv som följer Europeanas datamodell. För detta ändamål är PECAT anslutet till EuropeanaTranslates maskinöversättningsmotorer, som har finjusterats på metadata från Europeana.eu och stöder översättningen från alla europeiska språk till engelska. PECAT har också kopplats till verktyget för aggregering av MINT-metadata, som används av många kulturarvsinstitutioner och aggregatorer. Detta underlättar ett smidigt datautbyte mellan verktygen och en korrekt behandling och överföring av översättningar innan de publiceras på Europeana.eu.
MR: Tack så mycket för insikten! Vi kan inte vänta med att testa det - när kommer det att finnas tillgängligt?
MAG: Som jag nämnde tidigare, inom ramen för AI4Culture-projektet, släpper vi en öppen källkodsversion av PECAT. Denna version kan fritt användas av kulturarvsinstitutioner för deras metadataöversättningsuppgifter. Denna version kommer att finnas tillgänglig på AI4Culture-plattformen från och med september 2024.
Läs mer
Som Ma Ángeles García nämner kommer AI4Culture-projektet i september 2024 att lansera en plattform där öppna verktyg kommer att göras tillgängliga online, tillsammans med tillhörande dokumentation och utbildningsmaterial. Håll ett öga på projektsidan på Europeana Pro för mer information och håll ögonen öppna på projektet LinkedIn och X-konto!
