Europeana Fordítás
Az Europeana Translate eTranslation CEF távközlési projekt célja, hogy megerősítse az eTranslation infrastruktúra és a kulturális örökségnek az Europeana kezdeményezés által létrehozott közös európai adattere közötti kapcsolatokat, mindkettő javára. A projekt célja egyrészt a kulturális örökségi erőforrások használhatóságának javítása a kulturális örökségi adatkészletek többnyelvű metaadatokkal való gazdagítása révén. Másrészt növeli az európai nyelvi erőforrások koordinálásán keresztül nyíltan elérhetővé tett nyelvi erőforrásokat a kulturális örökséghez tartozó tárgyak millióinak metaadataival, amelyeket gondosan kiválasztottak, megtisztítottak és normalizáltak annak érdekében, hogy képzési célokra felhasználhatóvá váljanak.
E célból az Europeana Translate a kulturális örökség ágazatának igényeihez igazított gépi fordítási eszközöket fejlesztett ki és vezetett be. Az eszközöket jelenleg alkalmazzák az Europeana infrastruktúráján keresztül jelenleg rendelkezésre álló több mint 25 millió rekord metaadatainak 22 hivatalos uniós nyelvről angolra történő lefordítására, javítva a felhasználók számára biztosított többnyelvűséget.
A projekt során a partnerek a Pangeanic partner által biztosított fordítási motorokat képeztek ki az Europeana infrastruktúrájából kiválasztott metaadatokból, beleértve a két- és egynyelvű adatokat, valamint a többnyelvű szókincseket. Az OPUS gyűjtemény honlapjáról kiválasztott további adatokat is figyelembe vették a nem megfelelően reprezentált nyelvek esetében. Számos kísérletet végeztek annak eldöntésére, hogy melyik nyelv esetében melyik a legjobb kombináció a betanítási adatok és a motorbeállítások között. Az adatok képzés és tesztkészletek közötti felosztásával minden nyelvpár esetében elvégezték a standard mérőszámokon (például a BLEU-n és a TER-en) alapuló automatikus értékelést. Az eredmények jelentős javulást mutatnak az általános Pangeanic modellekhez (a tartományon belüli képzés előtt) és az eTranslation DSI-hez képest a legtöbb nyelv esetében.
Az automatikus fordítás emberi szakértők általi értékelése
Az automatikus fordításokat a nyelvészek és a kulturális örökséggel foglalkozó szakértők is széles körben értékelték. Az értékelőket arra kérték, hogy az automatikus angol nyelvű fordításokat 0-tól 100-ig terjedő skálán értékeljék, figyelembe véve olyan szempontokat, mint a folyékonyság (nyelvtani helyesség), a pontosság (általános jelentés) és a megfelelőség (a terminológia megfelelő használata). Arra is felkérték őket, hogy adjanak további visszajelzést, többek között jelentsék a fontos és visszatérő hibákat. A CrowdHeritage platformon keresztül három crowdsourcing kampányt szerveztek, hogy bevonják a kulturális örökség ágazatának tagjait. Összességében ezeken 44 szakértő nyelvész és 29 kulturális örökséggel foglalkozó szakember vett részt, akik a 22 nyelv többsége esetében meglehetősen magas (80% feletti) értékelést adtak.
Az emberi értékelés eredményei betekintést nyújtottak a gépi fordítómotorok viselkedésébe a különböző nyelveken. A hozzárendelt emberi minősítések mélyreható statisztikai elemzése a gépi fordítómotorok által kiszámított automatikus megbízhatósági pontszámokkal összefüggésben lehetővé tette számunkra, hogy megfelelő minőségi küszöbértékeket határozzunk meg a különböző nyelvekről az Europeana infrastruktúrájára történő fordítások közzétételéhez.
Előnyök a felhasználók és a kulturális örökséget ápoló intézmények számára
A fordítómotorokat az Europeana infrastruktúrája használja a metaadatok automatikus angol fordításának előállításához, indexálásához, megosztásához és megjelenítéséhez, ami lehetővé teszi az emberek számára az anyagok jobb felfedezését, elemzését és újrafelhasználását.
E munka pozitív hatását megerősítette egy hatásvizsgálati felmérés, amelyet 27 nyelvész és 18 kulturális örökséggel foglalkozó szakértő töltött ki. Arra a kérdésre, hogy az automatikus angol fordítás milyen hozzáadott értéket jelenthet a kulturális örökségi tárgyak keresésében és megjelenítésében az Europeana honlapján, mindkét közösség fontosnak tartotta. Arról is beszámoltak, hogy nagyra értékelik a keresési eredmények várható megnövekedett mennyiségét, amely olyan kulturális örökségi elemeket is magában foglalna, amelyeket jelenleg nem küldenek vissza az angol nyelvű keresés során: A kulturális örökséggel foglalkozó szakértők 83,4%-a, a nyelvészek 62,9%-a értékesnek tartotta ezt a javulást.
Ezenkívül a projekt által létrehozott fordítómotorok hasznosak lehetnek azon adatszolgáltatók számára, akik gyűjteményeik metaadatait angol nyelvre kívánják lefordítani, javítva gyűjteményeik hozzáférhetőségét. A MINT aggregációs platform felhasználói közvetlenül használhatják a meglévő API-kapcsolatokat a motorokkal, míg a kulturális örökséget ápoló, műszaki szakértelemmel rendelkező intézmények kihasználhatják az ELG adattárában nyíltan elérhető, könnyen telepíthető gépi fordítási motorokat. A felmérésben részt vevő kulturális örökséggel foglalkozó valamennyi szakértő kijelentette, hogy fontolóra veszi az Europeana Translate eszközök használatát annak érdekében, hogy szervezetük gyűjteményeit a fellelhetőség javítása érdekében automatikus fordításokkal gazdagítsák.
Europeana Translate Event - hogyan befolyásolja a gépi fordítás és a többnyelvű hozzáférés a kulturális örökséget
Szeretne többet megtudni az Europeana Translate projektről, annak módszertanáról és eredményeiről? Szeretné továbbá elmélyíteni a legkorszerűbb gépi fordítási technológiákkal kapcsolatos ismereteit, és azt, hogy azok hogyan alkalmazhatók a kulturális örökség ágazatában?
Csatlakozzon hozzánk az Europeana Translate rendezvényen – Hogyan hat a gépi fordítás és a többnyelvű hozzáférés a kulturális örökségre? Ez egy online esemény, amelyre 2023. április 13-án, közép-európai idő szerint 14:00 és 17:00 óra között kerül sor. Hallani fogja, hogy a projektpartnerek részletesen elmagyarázzák az e két éves munka során elért módszertant és eredményeket. Hasonló projekteket is meg fognak vitatni, mindig kritikusan figyelembe véve a kulturális örökségre vonatkozó adatok/metaadatok automatizált fordításának fontosságát, átgondolva a mesterségesintelligencia-technológia jövőbeli lépéseit, használhatóságát és kihívásait a kulturális örökség ágazata számára.
