Az APOLLONIS-ról
A digitális művészetek, a bölcsészettudományok, valamint a nyelvkutatás és -innováció görög infrastruktúrájával összefüggésben az APOLLONIS, az ATHENA R.C. által vezetett kijelölt munkacsoport azon dolgozik, hogy azonosítsa és támogassa a kutatók igényeit a különböző archívumokhoz való hozzáférés során. Az 1940-es évek levéltári anyagára összpontosít, amely jelentős eseményei (II. világháború, megszállás, ellenzék, felszabadítás, polgárháború) miatt a görög történelem viharos időszaka, és különböző szolgáltatóktól származó digitalizált történelmi archívumokat gyűjtött össze, hogy rávilágítson ezen események különböző történelmi vonatkozásaira.
A munkacsoportnak két fő célja van:
- Közös adattár kialakítása és fejlesztése az emberek, szervezetek, helyek, időpontok, témák és események metaadatai és indexei számára, lehetővé téve az emberek számára, hogy különböző archívumokban keressenek tartalmakat
- Digitális gondozási tevékenységek és munkafolyamatok meghatározása annak érdekében, hogy az adattár fejlesztése érdekében végzett munka megismételhető legyen, valamint a gazdagított tartalom további elemzésének és feldolgozásának támogatása.
A munkacsoportban az ATHENA R.C., az APOLLONIS koordinátora, az Athéni Akadémia, a FORTH, a Kommunikációs és Számítógépes Rendszerek Intézete/NTUA és az Athéni Képzőművészeti Iskola képviselői vesznek részt.
Az archívumok összekapcsolása - a folyamat
A munkacsoport tevékenységei interdiszciplinárisak és változatosak. Az erőforrások összegyűjtésétől kezdve egészen addig, hogy új formában kínáljuk őket a kutatóknak, rögzítjük munkafolyamatainkat. Ezek közé tartozik a digitalizált archívumok kezdeti gondozási folyamata, a lenyelés, az adatok közös indexálása, a szemantikai gráfreprezentációk előállítása és végül azok közzététele. Az alábbiakban részletezzük azokat a folyamatokat, amelyeken a munkacsoport keresztülment ennek elérése érdekében.
Miután megszereztük a forrásanyagokat, megvizsgáltuk azok szerkezetét és tartalmát annak érdekében, hogy a különböző archív metaadatokat egy közös metaadatsémára térképezzük fel, lehetővé téve a közös indexelést és szemantikai linkek létrehozását az archív tartalomban. A közös metaadat-séma az Europeana adatmodell (EDM) dúsított változata.
A következő lépés az adattisztítás volt, ahol a tipográfiai hibákat és érvénytelen vagy helytelen értékeket tartalmazó „piszkos” adatokat javították. Ezt követően bővítettük az adatkészleteket további információk azonosításával és a nyilvántartásokban való megjegyzésekkel - ezek az információk többnyire emberekre, helyekre, fegyveres egységekre, dátumokra és ismétlődő témákra vonatkoznak, ezért kihasználtuk a természetes nyelvi feldolgozás (NLP) technikáit. A megoldandó kihívások közé tartoznak a különböző tartalomformátumok és sémák, a szókincs és a terminológia eltérései, az ugyanazon gyűjteményen belüli és a gyűjtemények közötti tartalomszabványosítás következetlenségei, valamint a helyesírási és tipográfiai hibák, a görög és latin karakterek használata, a rövidítések és a deklinációk.
A kapott fájlokat XML formátumban fejezték ki és aggregálták. Ez a strukturálási folyamat teret enged a témát ismerő kutatók további gazdagításának. Elsődleges célunk azonban az összetett kutatási lekérdezések támogatása. E célból végül különböző források összekapcsolásával szervezték meg az adatokat.
A munkacsoport azonnali tervei között szerepel számos archívum anyagának teljes körű lenyelése és indexálása a megfelelő szemantikai grafikon elkészítése érdekében. Az új levéltárak beépítése természetes folytatása lenne munkánknak, és további együttműködések is üdvözlendők lennének.
Továbbfejlesztett archívumok a kutatás támogatására
Ez a folyamatban lévő munka javítani fogja a jelenlegi felhasználói élményt azáltal, hogy a megőrzési kérdések kezelése mellett új és innovatív módon megkönnyíti a tartalomhoz való hozzáférést. Az APOLLONIS-t használó kutatóknak nem kell hat különböző archívumban keresniük, és nem kell a tárgyak időrendjével vagy rögzítésük módjával kapcsolatos problémákkal szembesülniük.
Munkánk befejezése után a kutatók egyszerre férhetnek hozzá a különböző archívumokhoz és a gazdagított erőforrásokhoz. Képesek lesznek a projekt részeként kidolgozott kurátori és tartalomelemzési munkafolyamatok használatára is. A projekt ezért bemutatja és tükrözi, hogy a digitális gondozás hogyan lehet köztes lépés ahhoz, hogy hasznos forrásokat kínáljanak a kutatóknak, és hogy a kutatók hogyan működhetnek együtt a kulturális örökséget ápoló intézményekkel erőforrásaik gazdagítása érdekében.
Tudjon meg többet
Az APOLLONIS munkacsoport egyike a második világháború digitális erőforrásaival kapcsolatos projekteknek, amelyeket az Athena RC által 2020. szeptember 10-én szervezett webináriumon vitatnak meg az Europeana Research 2018–2020-as együttműködésének keretében. Fedezze fel a programot és regisztráljon!
