Марко Рендина: Можете ли да обясните какво е CAT инструмент?
Ma Ángeles García: Разбира се, че е така! CAT Tool - съкратено от Computer-Assisted Translation Tool - се използва за съхраняване и извличане на преводи, когато те се предоставят от преводаческа услуга. Инструментът CAT улеснява процеса на превод, като разделя текста на по-малки, преводачески сегменти и организира тези сегменти по начин, който улеснява преводача да ги управлява ефективно. Това прави процеса на превод ефективен във времето.
Сегментите могат да бъдат извлечени по-късно, като се гарантира, че преводачът се придържа към оригиналната терминология и стил на писане. Този инструмент осигурява съвпадения за материал, подобен на преди това преведено съдържание, като допълнително намалява грешките чрез запазване на преведените сегменти заедно с фразите на източника. Преводачът може лесно да получи достъп до всеки преведен сегмент по всяко време, за да осигури точен превод.
Разработени са компютърно подпомагани инструменти за превод, които позволяват на преводачите бързо да търсят и променят текстови сегменти, ако е необходимо. Тези инструменти също така спомагат за навременното преразглеждане.
Например изреченията „котката е дебела“ и „котката е черна“ са 75 % сходни. Ако нашата база данни знае как да преведе „котката е дебела“, тя ще предложи този превод, като изисква от преводача човек да промени само „дебела“ на „черна“.
МР: Защо професионалист в областта на културното наследство трябва да използва инструмент за КАТ?
МАГ: Когато специалистите в областта на културното наследство трябва да качват текстови данни в Europeana.eu, те могат да използват инструмент за CAT, за да преразгледат съдържанието по бърз и ефективен начин. Те могат да изградят свои собствени преводачески памети и да „рециклират“ вече преведени материали. Когато публикувате подобно съдържание, инструментът за компютърно подпомаган превод може да ви помогне да получите надеждни и последователни преводи. Инструментът CAT на Pangeanic, наречен PECAT, предоставя редица предимства: спестяване на време, намаляване на грешките, последователност и способност за боравене със сложна терминология.
МР: Можете ли да обясните как PECAT постига това?
MAG: Разбира се! PECAT разделя текста, който трябва да бъде преведен на сегменти, които могат да бъдат изречения, абзаци или отделни думи. Тези сегменти са представени по удобен начин, което прави превода по-лесен и по-бърз. Преводът на всеки сегмент се записва заедно с оригиналния текст и двете се съхраняват в системата на базата данни като Преводачески отдел (TU).
PECAT предлага функции за контрол на качеството, за да осигури последователност и точност на превода. Когато редактирате машинен превод, оценката на качеството на превода е от решаващо значение. PECAT осигурява оценка на доверието за всеки преводачески отдел, което позволява на потребителите да приоритизират редактирането на единици с по-ниски оценки или да се съсредоточат върху такива с по-високи оценки, като отхвърлят останалите.
Освен това PECAT позволява на потребителите да приемат или отхвърлят преводачески единици. Това е особено полезно, когато несемантичен текст, като код или символи, погрешно е включен в текста, който трябва да бъде редактиран. Потребителите могат просто да отхвърлят тези сегменти, за да ги премахнат.
МР: Какво прави PECAT полезен за институциите в областта на културното наследство и как е пригоден да обслужва техните нужди?
МАГ: В хода на проекта AI4Culture инструментът PECAT на Pangeanic беше адаптиран, за да обслужва нуждите на общността в областта на културното наследство. Получената версия на PECAT ще бъде пусната като инструмент с отворен код и безплатна онлайн услуга, позволяваща на институциите за културно наследство да се възползват от няколко уникални функционалности. Това е универсален инструмент, който използва както машинния, така и човешкия опит, за да осигури висококачествени преводи, което го прави идеален за управление на сложни задачи за превод в настройките на културното наследство. Той подобрява както индивидуалните, така и съвместните проекти за превод, като предлага ефективен контрол на работния процес, адаптивност към нуждите на потребителите и лекота на използване, без да се изисква техническа експертиза. PECAT също така предоставя функции като текстово показване един до друг, сигурна работна среда и разширено филтриране на сегменти от превода според техния статус на валидиране или доверителен рейтинг.
Освен това инструментите бяха разширени със специализирани функции, които подпомагат ефективното обработване на записите на метаданни за културното наследство, които следват модела на данни Europeana. За тази цел PECAT е свързан с машините за машинен превод EuropeanaTranslate, които са прецизирани по отношение на метаданните от Europeana.eu и поддържат превода от всички европейски езици на английски език. PECAT е свързан и с инструмента за обобщаване на метаданни MINT, използван от много институции и агрегатори в областта на културното наследство. Това подпомага безпроблемния обмен на данни между инструментите и точната обработка и предаване на преводите, преди те да бъдат публикувани на Europeana.eu.
МР: Много благодаря за прозрението! Нямаме търпение да го тестваме - кога ще бъде наличен?
МАГ: Както споменах по-рано, в рамките на проекта AI4Culture, ние пускаме версия с отворен код на PECAT. Тази версия може да се използва свободно от институциите в областта на културното наследство за техните задачи по превод на метаданни. Тази версия ще бъде достъпна на платформата AI4Culture от септември 2024 г.
Научете повече
Както посочва Ma Ángeles García, през септември 2024 г. проектът AI4Culture ще стартира платформа, на която отворените инструменти ще бъдат достъпни онлайн, заедно със съответната документация и обучителни материали. Следете страницата на проекта в Europeana Pro за повече подробности и следете профила на проекта LinkedIn и X!
