Tietoa kohteesta APOLLONIS
Kreikan digitaalisen taiteen, humanististen tieteiden ja kielitutkimuksen ja -innovoinnin infrastruktuurin yhteydessä APOLLONIS, nimetty työryhmä, jota johtaa Athene R.C., pyrkii tunnistamaan ja tukemaan tutkijoiden tarpeita heidän käyttäessään erilaisia arkistoja. Se keskittyy 1940-luvun arkistoaineistoon, joka on Kreikan historian myrskyisä ajanjakso merkittävien tapahtumiensa (toinen maailmansota, miehitys, oppositio, vapautus, sisällissota) vuoksi, ja on koonnut digitoituja historiallisia arkistoja eri toimittajilta valottamaan näiden tapahtumien erilaisia historiallisia näkökohtia.
Työryhmällä on kaksi päätavoitetta:
- Suunnitellaan ja kehitetään yhteinen metatieto- ja hakemistorekisteri ihmisiä, organisaatioita, paikkoja, aikoja, aiheita ja tapahtumia varten, jotta ihmiset voivat hakea sisältöä eri arkistoista.
- Määritellään digitaalisen kuratoinnin toimet ja työnkulut, jotta arkiston kehittämiseen liittyvä työ voidaan toistaa, ja tuetaan rikastetun sisällön analysointia ja käsittelyä.
Työryhmässä, joka on edelleen käynnissä, on jäseniä Athene R.C.:stä, APOLLONIS:n koordinaattorista, Ateenan akatemiasta, FORTH:sta, viestintä- ja tietotekniikkainstituutista/NTUA:sta ja Ateenan kuvataidekoulusta.
Arkistojen yhdistäminen - prosessi
Työryhmän toiminta on monitieteistä ja vaihtelevaa. Resurssien yhdistämisestä niiden tarjoamiseen uudessa muodossa tutkijoille tallennamme työnkulkuja. Niihin kuuluvat digitoitujen arkistojen alustava kuratointiprosessi, nieleminen, tietojen yhteinen indeksointi, semanttisten graafisten esitysten tuottaminen ja lopuksi niiden julkaiseminen. Seuraavassa esitetään yksityiskohtaisesti prosessit, joita työryhmä on käynyt läpi tämän saavuttamiseksi.
Lähdeaineistojen hankinnan jälkeen tutkimme niiden rakennetta ja sisältöä kartoittaaksemme erilaisia arkiston metatietoja yhteiseen metatietomalliin, mikä mahdollisti yhteisen indeksoinnin ja semanttisten linkkien luomisen arkiston sisältöön. Yhteinen metatietomalli on rikastettu versio Europeana-tietomallista (EDM).
Seuraava vaihe oli tietojen puhdistaminen, jossa korjattiin ”likaiset” tiedot, jotka sisälsivät kirjoitusvirheitä ja virheellisiä tai virheellisiä arvoja. Tämän jälkeen paransimme tietoaineistoja tunnistamalla lisätietoja ja merkitsemällä ne tietueisiin - nämä tiedot liittyvät enimmäkseen ihmisiin, paikkoihin, aseistettuihin yksiköihin, päivämääriin ja toistuviin aiheisiin, ja siksi hyödynsimme luonnollisen kielen käsittelytekniikoita (NLP). Haasteita ovat erilaiset sisältömuodot ja -kaaviot, sanastojen ja terminologioiden vaihtelut, epäjohdonmukaisuudet sisällön standardoinnissa saman kokoelman sisällä ja eri kokoelmissa sekä kirjoitus- ja kirjoitusvirheet, kreikan- ja latinankielisten merkkien käyttö, lyhenteet ja deklinaatiot.
Tuloksena saadut tiedostot ilmaistiin XML-muodossa ja koottiin yhteen. Tämä strukturointiprosessi jättää tilaa lisärikastukselle aiheeseen perehtyneille tutkijoille. Mutta ensisijainen tavoitteemme on tukea monimutkaisia tutkimuskyselyitä. Tätä varten tiedot organisoitiin lopulta yhdistämällä eri lähteitä.
Työryhmän välittömiin suunnitelmiin kuuluu aineiston täysimittainen nieleminen ja indeksointi useista arkistoista vastaavan semanttisen kaavion tuottamiseksi. Uusien arkistojen yhdistäminen olisi luonteva jatko työllemme, ja lisäyhteistyö olisi tervetullutta.
Parannetut arkistot tutkimuksen tueksi
Tällä meneillään olevalla työllä parannetaan nykyistä käyttäjäkokemusta helpottamalla sisällön saatavuutta uusilla ja innovatiivisilla tavoilla sen lisäksi, että käsitellään säilytyskysymyksiä. APOLLONIS-tietokantaa käyttävien tutkijoiden ei tarvitse tehdä hakuja kuudesta eri arkistosta tai kohdata aineiston aikajärjestykseen tai tallennustapoihin liittyviä ongelmia.
Kun työmme on valmis, tutkijat pääsevät käsiksi erilaisiin arkistoihin ja rikastettuihin resursseihin samanaikaisesti. He voivat myös käyttää kuratoinnin ja sisällönanalyysin työnkulkuja, jotka on kehitetty osana hanketta. Hanke osoittaa ja heijastaa sitä, miten digitaalinen kuratointi voi olla välivaihe hyödyllisten resurssien tarjoamisessa tutkijoille ja miten tutkijat voivat tehdä yhteistyötä kulttuuriperintölaitosten kanssa resurssiensa rikastamiseksi.
Lue lisää
APOLLONIS-työryhmä on yksi toisen maailmansodan digitaalisia resursseja koskevista hankkeista, joista keskustellaan Athena RC:n 10. syyskuuta 2020 järjestämässä verkkoseminaarissa sen ja Europeana Researchin 2018–2020 välisen yhteistyön puitteissa. Tutustu ohjelmaan ja rekisteröidy!
