2015 januárja óta az Europeana az Európai Unió egyik digitális szolgáltatási infrastruktúrája. Az EU-ban ezek közül több is létezik, többek között a gyermekek számára biztonságosabb internet, az elektronikus egészségügyi szolgáltatások és a vállalkozásirányítás. Az Europeana DSI az Europeana gyűjtemények platformján keresztül online hozzáférést biztosít Európa kulturális és tudományos örökségéhez, és támogatja a kulturális örökséget ápoló intézményeket a digitális korhoz való alkalmazkodásban.
Tavaly az Európai Bizottság közzétette az Europeana értékelését, amely felvázolta eredményeinket és néhány olyan területet, amelyre a jövőben összpontosítani kell. Ebben a sorozatban megvizsgálunk néhány olyan Europeana DSI-tevékenységet, amelyet az értékelés prioritásnak tekintett, így jobban megértheti azokat a törekvéseket és kihívásokat, amelyeken jelenleg dolgozunk.
Az Ön által beszélt nyelv nem jelenthet akadályt abban, hogy megtalálja, amit szeretne az Europeana gyűjteményekben, de jelenleg lehet, hogy igen. Tudd meg, mit teszünk azért, hogy ezt helyrehozzuk.
Az Europeana gyűjtemények az EU 28 tagállamának galériáiból, könyvtáraiból, levéltáraiból és múzeumaiból származó anyagokat tartalmaznak. A honlapon 27 nyelven navigálhat, és könnyen rákereshet a saját nyelvén leírt elemekre. De a dolgok bonyolultabbá válnak, ha olyan elemeket szeretne látni, amelyek megfelelnek a keresésnek, de más nyelven vannak leírva.
Összesen 37 nyelvet használnak a gyűjtemények leírására. Az összes anyag több mint fele (57%) azonban az öt nyelv egyikét használja - angol, német, holland, norvég vagy francia.
Az egyik nyelven leírt elem megjelenítése a találatokban vagy a kapcsolódó anyagokban, amikor egy másik nyelven keres rá, nem könnyű. Tudjuk, hogy még hosszú út áll előttünk, de az egyik prioritásunk, hogy pozitív változásokat érjünk el ezen a területen.
Célunk
Azt akarjuk, hogy az emberek megtalálják, amit keresnek – még akkor is, ha nem azt a nyelvet használják, amelyen a céltárgyat leírták.
Szeretnénk növelni annak az esélyét, hogy az egyik nyelven való keresés olyan eredményeket hozzon, amelyek megfelelnek az Ön kritériumainak egy másik nyelven.
Kihívások
Az automatikus fordítás egyre jobb, de nem hibabiztos, amint azt láthatta, ha valaha is használt olyan online eszközt, mint a Google Translate. Az Europeana gyűjtemények esetében további komplikációk merülnek fel. Nem arra koncentrálunk, hogy egy adott nyelvet lefordítsunk egy másikra. 37 nyelven írt gyűjteményekkel dolgozunk, és megpróbáljuk összepárosítani azokat olyan keresőkifejezésekkel, amelyek bármely nyelven elérhetők. Ráadásul a metaadatok nem olyanok, mint a természetes nyelv, teljes mondatokkal és kiszámítható nyelvtannal; gyakran rövid mondatokban vagy akár egyetlen szóban szerepel, ami azt jelenti, hogy nehéz megtalálni a pontos fordításhoz szükséges kontextust. A komplexitás egy másik rétege az a tény, hogy a használt kifejezések nagyon specifikusak lehetnek - úgy tűnhetnek, mint egy közös kifejezés, de más jelentéssel bírnak, ha a digitális kulturális anyagok leírásával összefüggésben használják őket.
Az automatizált folyamatok csak akkor működnek, ha a helyes és megfelelő információkat táplálják. Ez nyilvánvalónak tűnik, de amint azt a sorozat korábbi bejegyzéseiben láthattuk, az Europeanának nyújtott információk mélysége és minősége jelentősen eltér egymástól.
Annak érdekében, hogy bármit le lehessen fordítani, tudnunk kell, hogy az eredeti elem milyen nyelven áll rendelkezésre. A rendszereink nem találgatnak. Tehát minden elemnek (például a címnek és a leírásnak) szüksége van egy nyelvi jelölőre. Ez egy újabb információréteg, amelyet a kulturális örökséget ápoló intézményeknek rendelkezésre kell bocsátaniuk.
Mit csinálunk?
Új innovációk
Idén felülvizsgáltuk minőségi szabványunkat, az Europeana közzétételi keretrendszert, hogy a tartalomra vonatkozó meglévő szabványok mellett a metaadatokra vonatkozó szabványokat is tartalmazzon. Most arra ösztönzi a metaadatokon dolgozó embereket, hogy fordítsák le az elemeket, például a címeket több nyelvre, és a kontextusokat, például a helyneveket - amelyek maguk is többnyelvűek - kontextuális szókincsekből foglalják bele (lásd az alábbi pontot). A keretrendszer ösztönzi továbbá a legfontosabb nyelvi címkék használatát annak jelzésére, hogy melyik nyelvet használják. Ez kiszámolja a találgatást, és azt jelenti, hogy automatikusabb összekapcsolási és fordítási folyamatok valósíthatók meg.
Az Europeana Alapítvány és Hálózati Szövetség szakértelmének felhasználása mellett mások munkájára is támaszkodunk az Europeana gyűjtemények többnyelvűségének javítása érdekében. Az elmúlt évben kísérleti projektet hajtottunk végre az eTranslation csapattal - egy másik, az Európai Unió által finanszírozott DSI projekttel. Erre a kísérleti projektre építve további kísérleti tevékenységeket folytatunk annak érdekében, hogy kihasználjuk a projekt automatikus fordítási potenciálját az Europeana számára.
Folyamatban lévő tevékenységek
Ha egy mondat megfelelő kontextusba kerül, sokkal könnyebb lefordítani. Továbbra is használjuk a metaadatok gazdagítását, hogy több kontextust biztosítsunk az Europeana gyűjteményekben található anyagokhoz. Erőfeszítéseink közé tartozik a „kontextuális szótárak” használata, különösen azoké, amelyek kapcsolt nyílt adatként állnak rendelkezésre. Ezek az adatkészletek további részleteket tartalmaznak, például többnyelvű címkéket, kulcsfogalmak fordítását vagy a személyek és helyek nevének különböző változatait. Ez megkönnyíti az Europeana gyűjteményekben található tárgyak keresését és megtalálását. A szótárakat az adatszolgáltatók vagy az Europeana különböző (fél)automatikus metaadat-dúsítási folyamatok részeként használhatják.
Európa többnyelvű. Nekünk is annak kell lennünk. Hálásak vagyunk partnereinknek és barátainknak, hogy segítettek több nyelvre lefordítani az olyan fontos elemeket, mint az Europeana közzétételi kerete és az Europeana által használt jognyilatkozatok (azok az információk, amelyekből megtudhatja, hogy mit tehet egy, az Europeanán található tárggyal, pl. szerzői jogvédelem alatt áll-e vagy közkincs-e?). Eddig a jognyilatkozatoknak hét fordítása van, további hat pedig úton van.
Az Europeana Collections weboldala 27 nyelven érhető el, idén pedig hét nyelven új kiállítást mutattunk be Heritage at Risk (Kockázatnak kitett örökség) címmel.
Mire kell figyelni...
Az Europeana többnyelvűségének növelése prioritás, és az EU Tanácsának finn elnöksége alatt idén októberben megrendezésre kerülő kétnapos rendezvény témája. A rendezvényen az Europeana Alapítvány és a finn Oktatási és Kulturális Minisztérium a digitális kulturális örökség többnyelvűségével kapcsolatos igényekre, elvárásokra és további lépésekre összpontosít.
Te is segíthetsz. Partnereinkkel „Transcribathon” rendezvényeket szervezünk, amelyeken bárki részt vehet (akár otthon online, akár fizikai rendezvényen), és begépelheti a gyakran kézzel írott szöveges dokumentumok tartalmát, hogy azok könnyebben hozzáférhetők és kereshetők legyenek, és gépi fordítást lehessen készíteni. Az elmúlt évben öt transzkripciót szerveztek európai örökségvédelmi intézményekkel együttműködésben (Németország, Olaszország, Belgium, Ausztria, Románia), és közel 3000, az első világháborúval kapcsolatos dokumentumot írtak le.
Tudjon meg többet
Tudjon meg többet automatikus dúsításainkról vagy az Európai Unió eTranslation tevékenységéről.
Ha pedig érdeklik az Europeana közzétételi keretrendszer nyelvi elemeinek részletei, tekintse meg az Europeana közzétételi útmutatóját is, amely pontosan részletezi, hogy mire van szükség az adatok Europeanának történő benyújtásakor.
Az EuropeanaTech erőfeszítéseket tett a többnyelvűség terén, lásd például a többnyelvű hozzáférés bevált gyakorlatait és a nyelvi kérdések kezeléséről szóló különböző előadásokat a legutóbbi EuropeanaTech konferencián.
A Transcribathon.eu-hoz való csatlakozással pedig többnyelvűbbé teheti az Europeanát. Itt angol, francia és német nyelvű oktatóanyagokat, valamint a következő rendezvényeinkről szóló információkat talál.
