Информация за APOLLONIS
В контекста на гръцката инфраструктура за цифрови изкуства, хуманитарни науки и езикови изследвания и иновации APOLLONIS — специална работна група, ръководена от ATHENA R.C. — работи по идентифицирането и подпомагането на нуждите на изследователите при достъпа до разнородни архиви. Той се фокусира върху архивни материали от десетилетието на 40-те години на миналия век, бурен период в гръцката история поради значимите събития (WWII, окупация, опозиция, освобождение, гражданска война) и е събрал дигитализирани исторически архиви от различни доставчици, за да хвърли светлина върху различни исторически аспекти на тези събития.
Работната група има две основни цели:
- Проектиране и разработване на съвместно хранилище за метаданни и индекси за хора, организации, места, часове, теми и събития, за да се даде възможност на хората да търсят съдържание в различни архиви
- Определяне на дейностите и работните процеси за цифрово поддържане, така че работата, предприета за разработване на хранилището, да може да бъде възпроизведена и да поддържа по-нататъшен анализ и обработка на обогатеното съдържание.
Работната група, която все още е в ход, включва членове от ATHENA R.C., координатор на APOLLONIS, Атинската академия, FORTH, Института по комуникации и компютърни системи/NTUA и Атинското училище за изящни изкуства.
Обединяване на архивите - процесът
Дейностите на работната група са интердисциплинарни и разнообразни. От обединяването на ресурси до предлагането им в нова форма на изследователите, ние записваме нашите работни потоци. Те включват първоначалния процес на поддържане на цифровизираните архиви, поглъщането, съвместното индексиране на данните, генерирането на изображения на семантични графики и накрая, тяхното публикуване. По-долу подробно описваме процесите, през които работната група е преминала, за да постигне това.
След като се сдобихме с изходните материали, проучихме тяхната структура и съдържание, за да картографираме различни архивни метаданни върху обща схема на метаданните, позволявайки съвместно индексиране и установяване на семантични връзки в архивното съдържание. Общата схема за метаданни е обогатена версия на модела на данни Europeana (EDM).
Следващата стъпка беше почистване на данните, при което бяха коригирани „мръсни“ данни, включващи печатни грешки и невалидни или неправилни стойности. След това подобрихме наборите от данни, като идентифицирахме допълнителна информация и я анотирахме в записите - тази информация е свързана най-вече с хора, места, въоръжени части, дати и повтарящи се теми и затова се възползвахме от техниките за обработка на естествен език (NLP). Разглежданите предизвикателства включват различни формати и схеми на съдържанието, вариации в речниците и терминологиите, несъответствия в стандартизацията на съдържанието в рамките на една и съща колекция и между колекциите, както и правописни и типографски грешки, използване на гръцки и латински букви, съкращения и деклинации.
Получените файлове бяха изразени във формат XML и обобщени. Този процес на структуриране оставя място за по-нататъшно обогатяване от изследователи, запознати с темата. Но основната ни цел е да подкрепим сложни изследователски запитвания. За тази цел данните най-накрая бяха организирани чрез свързване на различни източници.
Непосредствените планове на работната група включват пълно поглъщане и индексиране на материала от редица архиви, за да се създаде съответна семантична графика. Включването на нови архиви би било естествено продължение на нашата работа и по-нататъшното сътрудничество би било добре дошло.
Подобрени архиви в подкрепа на научните изследвания
Тази текуща работа ще подобри настоящия потребителски опит чрез улесняване на достъпа до съдържание по нови и иновативни начини, в допълнение към решаването на проблемите, свързани със съхранението. Изследователите, които използват APOLLONIS, няма да трябва да търсят в шест различни архива или да се сблъскват с проблеми, свързани с хронологията на елементите или с начините, по които те са били записани.
Когато работата ни приключи, изследователите ще имат достъп до различни архиви и обогатени ресурси едновременно. Те също така ще могат да използват работните процеси за куриране и анализ на съдържанието, разработени като част от проекта. Ето защо проектът демонстрира и отразява как цифровото куриране може да бъде междинна стъпка към предлагането на полезни ресурси на изследователите и как изследователите могат да си сътрудничат с институциите за културно наследство, за да обогатят своите ресурси.
Научете повече
Работната група APOLLONIS е един от проектите за цифрови ресурси за Втората световна война, който ще бъде обсъден на уебинар, организиран от Athena RC на 10 септември 2020 г. в рамките на сътрудничеството ѝ с Europeana Research 2018—2020 г. Разгледайте програмата и се регистрирайте!
