Marco Rendina: Czy możesz wyjaśnić, co to jest narzędzie CAT?
Ma Ángeles García: Pewnie! Narzędzie CAT - skrót od Computer-Assisted Translation Tool - służy do przechowywania i pobierania tłumaczeń, gdy są one dostarczane przez służby tłumaczeniowe. Narzędzie CAT ułatwia proces tłumaczenia, dzieląc tekst na mniejsze, możliwe do przetłumaczenia segmenty i organizując te segmenty w sposób ułatwiający tłumaczowi skuteczne zarządzanie nimi. Dzięki temu proces tłumaczenia jest efektywny czasowo.
Segmenty można pobrać później, upewniając się, że tłumacz przestrzega oryginalnej terminologii i stylu pisania. To narzędzie zapewnia dopasowania dla materiałów podobnych do wcześniej przetłumaczonych treści, dodatkowo redukując błędy poprzez zapisanie przetłumaczonych segmentów obok fraz źródłowych. Tłumacz może łatwo uzyskać dostęp do każdego przetłumaczonego segmentu w dowolnym momencie, aby zapewnić dokładne tłumaczenie.
Opracowano narzędzia do tłumaczenia wspomagane komputerowo, aby umożliwić tłumaczom szybkie wyszukiwanie i modyfikowanie segmentów tekstu w razie potrzeby. Narzędzia te pomagają również w terminowym przeglądzie.
Na przykład zdania „kot jest gruby” i „kot jest czarny” są w 75 % podobne. Jeśli nasza baza danych wie, jak przetłumaczyć „kot jest gruby”, zaproponuje to tłumaczenie, wymagając od tłumacza zmiany tylko „tłuszczu” na „czarny”.
MR: Dlaczego specjalista ds. dziedzictwa kulturowego powinien korzystać z narzędzia CAT?
MAG: Gdy osoby zawodowo zajmujące się dziedzictwem kulturowym muszą przesyłać dane tekstowe do Europeana.eu, mogą skorzystać z narzędzia CAT, aby szybko i skutecznie zmienić treść. Mogą tworzyć własne wspomnienia tłumaczeniowe i „poddawać recyklingowi” wcześniej przetłumaczony materiał. Podczas publikowania podobnych treści narzędzie do tłumaczenia wspomaganego komputerowo może pomóc w uzyskaniu wiarygodnych i spójnych tłumaczeń. Narzędzie CAT firmy Pangeanic, zwane PECAT, zapewnia szereg korzyści: oszczędność czasu, redukcja błędów, spójność i umiejętność obsługi złożonej terminologii.
MR: Czy możesz wyjaśnić, w jaki sposób PECAT to osiąga?
MAG: Oczywiście! PECAT dzieli tekst do przetłumaczenia na segmenty, które mogą być zdaniami, akapitami lub pojedynczymi słowami. Segmenty te są prezentowane w wygodny sposób, dzięki czemu tłumaczenie jest łatwiejsze i szybsze. Tłumaczenie każdego segmentu jest zapisywane wraz z tekstem oryginalnym, a oba są przechowywane w systemie bazy danych jako jednostka tłumaczeniowa (TU).
PECAT oferuje funkcje kontroli jakości w celu zapewnienia spójności i dokładności tłumaczenia. Podczas edycji tłumaczeń maszynowych kluczowe znaczenie ma oszacowanie jakości tłumaczenia. PECAT zapewnia wynik zaufania dla każdej jednostki tłumaczeniowej, pozwalając użytkownikom na priorytetowe traktowanie edycji jednostek o niższej punktacji lub skupienie się na jednostkach o wyższej punktacji, jednocześnie odrzucając resztę.
Dodatkowo PECAT umożliwia użytkownikom akceptowanie lub odrzucanie jednostek tłumaczeniowych. Jest to szczególnie przydatne, gdy tekst niesemantyczny, taki jak kod lub symbole, jest błędnie włączany do tekstu, który ma być edytowany. Użytkownicy mogą po prostu odrzucić te segmenty, aby je usunąć.
MR: Co sprawia, że PECAT jest przydatny dla instytucji dziedzictwa kulturowego i w jaki sposób został dostosowany do ich potrzeb?
MAG: W ramach projektu AI4Culture narzędzie PECAT firmy Pangeanic zostało dostosowane do potrzeb społeczności dziedzictwa kulturowego. Powstała wersja PECAT zostanie udostępniona jako narzędzie open source i bezpłatna usługa online, umożliwiająca instytucjom dziedzictwa kulturowego korzystanie z kilku unikalnych funkcji. Jest to wszechstronne narzędzie, które wykorzystuje zarówno wiedzę maszynową, jak i ludzką, aby zapewnić wysokiej jakości tłumaczenia, dzięki czemu idealnie nadaje się do zarządzania złożonymi zadaniami tłumaczeniowymi w środowisku dziedzictwa kulturowego. Ulepsza zarówno indywidualne, jak i oparte na współpracy projekty tłumaczeniowe, oferując wydajną kontrolę przepływu pracy, możliwość dostosowania do potrzeb użytkownika i łatwość obsługi bez konieczności korzystania z wiedzy technicznej. PECAT oferuje również takie funkcje, jak wyświetlanie tekstu obok siebie, bezpieczne środowisko pracy i zaawansowane filtrowanie segmentów tłumaczenia zgodnie z ich statusem walidacji lub wynikiem zaufania.
Ponadto narzędzia te rozszerzono o wyspecjalizowane funkcje, które wspierają skuteczne przetwarzanie zapisów metadanych dotyczących dziedzictwa kulturowego zgodnie z modelem danych Europeany. W tym celu PECAT jest połączony z mechanizmami tłumaczenia maszynowego EuropeanaTranslate, które zostały dopracowane pod kątem metadanych z Europeana.eu i obsługują tłumaczenie ze wszystkich języków europejskich na angielski. PECAT został również połączony z narzędziem agregacji metadanych MINT, wykorzystywanym przez wiele instytucji dziedzictwa kulturowego i agregatorów. Umożliwia to sprawną wymianę danych między narzędziami oraz dokładne przetwarzanie i przekazywanie tłumaczeń przed ich publikacją na stronie Europeana.eu.
MR: Wielkie dzięki za wgląd! Nie możemy się doczekać, aby go przetestować - kiedy będzie dostępny?
MAG: Jak wspomniałem wcześniej, w ramach projektu AI4Culture wydajemy wersję open source PECAT. Ta wersja może być swobodnie wykorzystywana przez instytucje dziedzictwa kulturowego do zadań związanych z tłumaczeniem metadanych. Wersja ta będzie dostępna na platformie AI4Culture od września 2024 r.
Dowiedz się więcej
Jak wspomina Ma Ángeles García, we wrześniu 2024 r. w ramach projektu AI4Culture uruchomiona zostanie platforma, na której udostępnione zostaną otwarte narzędzia online, wraz z powiązaną dokumentacją i materiałami szkoleniowymi. Obserwuj stronę projektu na Europeana Pro, aby uzyskać więcej informacji i bądź na bieżąco z projektem LinkedIn i kontem X!
