Teave APOLLONISe kohta
Kreeka digikunsti, humanitaarteaduste ning keeleuuringute ja -innovatsiooni taristu kontekstis töötab ATHENA R.C. juhitud rakkerühm APOLLONIS selle nimel, et teha kindlaks teadlaste vajadused erinevatele arhiividele juurdepääsul ja neid toetada. See keskendub 1940. aastate kümnendi arhiivimaterjalile, mis on Kreeka ajaloos oma oluliste sündmuste (II maailmasõda, okupatsioon, opositsioon, vabastamine, kodusõda) tõttu turbulentne periood, ning on koondanud digiteeritud ajalooarhiive erinevatest pakkujatest, et heita valgust nende sündmuste erinevatele ajaloolistele aspektidele.
Rakkerühmal on kaks peamist eesmärki:
- Kavandada ja töötada välja metaandmete ja indeksite ühine hoidla inimestele, organisatsioonidele, kohtadele, aegadele, teemadele ja üritustele, et võimaldada inimestel otsida sisu eri arhiividest
- Määrata kindlaks digitaalsed kureerimistegevused ja töövood, et hoidla arendamiseks tehtud tööd saaks korrata, ning toetada rikastatud sisu edasist analüüsi ja töötlemist.
Töörühma, mis on veel töös, kuuluvad ATHENA R.C. liikmed, kes on APOLLONISe, Ateena akadeemia, FORTHi, kommunikatsiooni- ja arvutisüsteemide instituudi (NTUA) ja Ateena kaunite kunstide kooli koordinaator.
Arhiivide ühendamine - protsess
Rakkerühma tegevus on interdistsiplinaarne ja mitmekesine. Alates ressursside koondamisest kuni nende teadlastele uuel kujul pakkumiseni salvestame oma töövood. Need hõlmavad digiteeritud arhiivide esialgset korrastamist, allaneelamist, andmete ühist indekseerimist, semantiliste graafikute esitamist ja lõpuks nende avaldamist. Allpool kirjeldame üksikasjalikult protsesse, mida rakkerühm selle saavutamiseks läbis.
Pärast lähtematerjalide hankimist uurisime nende struktuuri ja sisu, et kaardistada erinevad arhiivi metaandmed ühisesse metaandmete skeemi, võimaldades ühist indekseerimist ja semantiliste linkide loomist arhiivi sisus. Ühine metaandmete skeem on Europeana andmemudeli (EDM) täiendatud versioon.
Järgmine samm oli andmete puhastamine, mille käigus parandati „määrdunud“ andmed, mis sisaldasid tüpograafilisi vigu ja vigaseid või ebaõigeid väärtusi. Seejärel täiendasime andmekogusid, tuvastades täiendavat teavet ja lisades selle kirjetesse - see teave on peamiselt seotud inimeste, kohtade, relvastatud üksuste, kuupäevade ja korduvate teemadega ning seetõttu saime kasu loomuliku keele töötlemise (NLP) tehnikatest. Käsitletavate probleemide hulka kuuluvad erinevad sisuvormingud ja skeemid, sõnastike ja terminoloogiate erinevused, vastuolud sisu standardimises sama kogu piires ja kogude vahel, samuti õigekirja- ja tüpograafilised vead, kreeka ja ladina tähtede kasutamine, lühendid ja deklinatsioonid.
Saadud failid esitati XML-vormingus ja koondati. See struktureerimisprotsess jätab teemaga kursis olevatele teadlastele ruumi edasiseks rikastamiseks. Kuid meie peamine eesmärk on toetada keerulisi uurimispäringuid. Selleks ühendati andmed lõpuks eri allikatega.
Rakkerühma kohesed plaanid hõlmavad mitme arhiivi materjali täiemahulist allaneelamist ja indekseerimist, et koostada vastav semantiline graafik. Uute arhiivide lisamine oleks meie töö loomulik jätk ja edasine koostöö oleks teretulnud.
Täiustatud arhiivid teadusuuringute toetamiseks
Käimasolev töö parandab praegust kasutajakogemust, hõlbustades juurdepääsu sisule uutel ja uuenduslikel viisidel ning käsitledes lisaks säilitamisega seotud küsimusi. APOLLONISt kasutavad teadlased ei pea otsima kuuest eri arhiivist ega puutuma kokku küsimustega, mis on seotud esemete kronoloogia või nende salvestamise viisiga.
Kui meie töö on lõpetatud, saavad teadlased samaaegselt juurdepääsu erinevatele arhiividele ja rikastatud ressurssidele. Samuti saavad nad kasutada projekti raames välja töötatud kureerimise ja sisuanalüüsi töövooge. Seetõttu näitab ja kajastab projekt seda, kuidas digitaalne kureerimine võib olla vaheetapp teadlastele kasulike ressursside pakkumisel ning kuidas teadlased saavad teha koostööd kultuuripärandiasutustega nende ressursside rikastamiseks.
Uuri lähemalt
APOLLONISe rakkerühm on üks II maailmasõja digiressursse käsitlevatest projektidest, mida arutatakse 10. septembril 2020 Athena RC korraldataval veebiseminaril koostöö raames Europeana Researchiga 2018–2020. Tutvuge programmiga ja registreeruge!
