Apie APOLLONIS
Graikijos skaitmeninių menų, humanitarinių mokslų ir kalbų mokslinių tyrimų ir inovacijų infrastruktūros srityje APOLLONIS, paskirta darbo grupė, kuriai vadovauja ATHENA R.C., siekia nustatyti ir remti tyrėjų poreikius, susijusius su prieiga prie skirtingų archyvų. Jame daugiausia dėmesio skiriama archyvinei medžiagai iš 1940-ųjų dešimtmečio, neramaus Graikijos istorijos laikotarpio dėl reikšmingų įvykių (II pasaulinio karo, okupacijos, opozicijos, išlaisvinimo, pilietinio karo), ir buvo surinkti suskaitmeninti įvairių teikėjų istoriniai archyvai, kad būtų atskleisti įvairūs šių įvykių istoriniai aspektai.
Darbo grupė siekia dviejų pagrindinių tikslų:
- Sukurti ir plėtoti bendrą metaduomenų ir rodyklių saugyklą žmonėms, organizacijoms, vietoms, laikams, temoms ir renginiams, kad žmonės galėtų ieškoti turinio įvairiuose archyvuose.
- Apibrėžti skaitmeninio kuravimo veiklą ir darbo srautus, kad būtų galima atkartoti saugyklos kūrimo darbą, ir remti tolesnę praturtinto turinio analizę ir apdorojimą.
Darbo grupę sudaro nariai iš ATHENA R.C., APOLLONIS koordinatoriaus, Atėnų akademijos, FORTH, Ryšių ir kompiuterinių sistemų instituto (NTUA) ir Atėnų dailės mokyklos.
Archyvų sujungimas - procesas
Darbo grupės veikla yra tarpdisciplininė ir įvairi. Nuo išteklių sutelkimo iki naujos formos siūlymo tyrėjams mes fiksuojame savo darbo eigą. Jie apima pradinį suskaitmenintų archyvų kuravimo procesą, nurijimą, bendrą duomenų indeksavimą, semantinių grafikų atvaizdų generavimą ir galiausiai jų paskelbimą. Toliau išsamiai aprašome procesus, kuriuos darbo grupė vykdė siekdama šio tikslo.
Įsigiję pradines medžiagas, ištyrėme jų struktūrą ir turinį, kad galėtume susieti skirtingus archyvų metaduomenis su bendra metaduomenų schema, leidžiančia bendrai indeksuoti ir nustatyti semantines nuorodas archyviniame turinyje. Bendra metaduomenų schema yra patobulinta Europeanos duomenų modelio (EDM) versija.
Kitas etapas buvo duomenų valymas, kai buvo ištaisyti „nešvarūs“ duomenys, apimantys spausdinimo klaidas ir netinkamas ar neteisingas vertes. Tada mes patobulinome duomenų rinkinius, identifikuodami papildomą informaciją ir anotuodami ją įrašuose - ši informacija daugiausia susijusi su žmonėmis, vietomis, ginkluotais vienetais, datomis ir pasikartojančiomis temomis, todėl mes pasinaudojome natūralios kalbos apdorojimo (NLP) metodais. Sprendžiami šie uždaviniai: skirtingi turinio formatai ir schemos, žodynų ir terminologijos skirtumai, tos pačios kolekcijos ir visų kolekcijų turinio standartizavimo nenuoseklumas, taip pat rašybos ir spausdinimo klaidos, graikų ir lotyniškų rašmenų naudojimas, santrumpos ir nukrypimai.
Gautos rinkmenos buvo išreikštos XML formatu ir apibendrintos. Šis struktūrizavimo procesas palieka erdvės tolesniam praturtinimui šią temą išmanantiems tyrėjams. Tačiau mūsų pagrindinis tikslas yra remti sudėtingas mokslinių tyrimų užklausas. Šiuo tikslu duomenys galiausiai buvo susisteminti susiejant skirtingus šaltinius.
Darbo grupės neatidėliotini planai apima plataus masto medžiagos iš įvairių archyvų nurijimą ir indeksavimą, kad būtų galima parengti atitinkamą semantinį grafiką. Naujų archyvų įtraukimas būtų natūrali mūsų darbo tąsa, o tolesnis bendradarbiavimas būtų sveikintinas.
Patobulinti archyvai moksliniams tyrimams remti
Šiuo vykdomu darbu bus pagerinta dabartinė naudotojų patirtis, nes bus palengvinta prieiga prie turinio naujais ir novatoriškais būdais, be to, bus sprendžiami išsaugojimo klausimai. Tyrėjams, kurie naudojasi APOLLONIS, nereikės ieškoti šešiuose skirtinguose archyvuose ar susidurti su problemomis, susijusiomis su elementų chronologija ar jų įrašymo būdais.
Kai mūsų darbas bus baigtas, mokslininkai galės vienu metu naudotis įvairiais archyvais ir praturtintais ištekliais. Jie taip pat galės naudoti kuravimo ir turinio analizės darbo eigas, sukurtas kaip projekto dalis. Todėl projektu parodoma ir atspindima, kaip skaitmeninis kuravimas gali būti tarpinis žingsnis siūlant naudingus išteklius tyrėjams ir kaip tyrėjai gali bendradarbiauti su kultūros paveldo įstaigomis, kad praturtintų savo išteklius.
Sužinokite daugiau
APOLLONIS darbo grupė yra vienas iš projektų, susijusių su Antrojo pasaulinio karo skaitmeniniais ištekliais, kurie bus aptarti internetiniame seminare, kurį 2020 m. rugsėjo 10 d. surengs Athena RC, bendradarbiaudama su „Europeana Research 2018–2020“. Susipažinkite su programa ir užsiregistruokite!
