Informacje o APOLLONIS
W kontekście greckiej infrastruktury na rzecz badań i innowacji w dziedzinie sztuki cyfrowej, nauk humanistycznych i językowych APOLLONIS, wyznaczona grupa zadaniowa kierowana przez ATHENA R.C., pracuje nad określeniem i wspieraniem potrzeb naukowców w zakresie dostępu do różnych archiwów. Koncentruje się na materiałach archiwalnych z dekady lat 40., burzliwego okresu w historii Grecji ze względu na jego znaczące wydarzenia (II wojna światowa, okupacja, opozycja, wyzwolenie, wojna domowa), i zgromadził zdigitalizowane archiwa historyczne od różnych dostawców, aby rzucić światło na różne historyczne aspekty tych wydarzeń.
Grupa zadaniowa ma dwa główne cele:
- Projektowanie i rozwijanie wspólnego repozytorium metadanych i indeksów dla osób, organizacji, miejsc, czasów, tematów i wydarzeń, aby umożliwić ludziom wyszukiwanie treści w różnych archiwach
- Aby zdefiniować cyfrowe działania kuratorskie i przepływy pracy, tak aby prace podjęte w celu opracowania repozytorium mogły być replikowane, oraz wspierać dalszą analizę i przetwarzanie wzbogaconych treści.
W skład grupy zadaniowej, która jest nadal w toku, wchodzą członkowie ATHENA R.C., koordynator APOLLONIS, Akademii Ateńskiej, FORTH, Instytutu Komunikacji i Systemów Komputerowych/NTUA oraz Szkoły Sztuk Pięknych w Atenach.
Łączenie archiwów - proces
Działania grupy zadaniowej są interdyscyplinarne i zróżnicowane. Od łączenia zasobów po oferowanie ich naukowcom w nowej formie, rejestrujemy nasze przepływy pracy. Obejmują one wstępną kurację zdigitalizowanych archiwów, pobieranie, wspólną indeksację danych, generowanie reprezentacji grafów semantycznych i wreszcie ich publikację. Poniżej szczegółowo opisujemy procesy, przez które przeszła grupa zadaniowa, aby to osiągnąć.
Po pozyskaniu materiałów źródłowych zbadaliśmy ich strukturę i zawartość w celu mapowania różnych metadanych archiwalnych na wspólny schemat metadanych, umożliwiając wspólne indeksowanie i tworzenie linków semantycznych w treści archiwalnej. Wspólny schemat metadanych jest wzbogaconą wersją modelu danych Europeany (EDM).
Kolejnym etapem było czyszczenie danych, w ramach którego skorygowano „brudne” dane zawierające błędy typograficzne oraz nieprawidłowe lub niepoprawne wartości. Następnie ulepszyliśmy zbiory danych, identyfikując dodatkowe informacje i umieszczając je w rejestrach - informacje te są głównie związane z ludźmi, miejscami, jednostkami zbrojnymi, datami i powtarzającymi się tematami, dlatego skorzystaliśmy z technik przetwarzania języka naturalnego (NLP). Podejmowane wyzwania obejmują różne formaty i schematy treści, różnice w słownictwie i terminologii, niespójności w standaryzacji treści w ramach tej samej kolekcji i między kolekcjami, a także błędy ortograficzne i typograficzne, stosowanie znaków greckich i łacińskich, skrótów i deklinacji.
Powstałe pliki zostały wyrażone w formacie XML i zagregowane. Ten proces strukturyzacji pozostawia miejsce na dalsze wzbogacenie przez naukowców zaznajomionych z tym tematem. Ale naszym głównym celem jest wspieranie złożonych zapytań badawczych. W tym celu ostatecznie zorganizowano dane, łącząc różne źródła.
Bezpośrednie plany grupy zadaniowej obejmują pełne pobranie i indeksowanie materiałów z szeregu archiwów w celu uzyskania odpowiedniego wykresu semantycznego. Włączenie nowych archiwów byłoby naturalną kontynuacją naszej pracy, a dalsza współpraca byłaby mile widziana.
Ulepszone archiwa wspierające badania
Te trwające prace poprawią obecne doświadczenia użytkowników poprzez ułatwienie dostępu do treści w nowy i innowacyjny sposób, a także rozwiązanie problemów związanych z ochroną. Naukowcy korzystający z APOLLONIS nie będą musieli przeszukiwać sześciu różnych archiwów ani napotykać problemów związanych z chronologią przedmiotów lub sposobami ich rejestrowania.
Po zakończeniu prac naukowcy będą mogli uzyskać dostęp do różnych archiwów i wzbogaconych zasobów jednocześnie. Będą również mogli korzystać z procesów kuratorskich i analizy treści opracowanych w ramach projektu. W związku z tym projekt pokazuje i odzwierciedla, w jaki sposób kuracja cyfrowa może być krokiem pośrednim w oferowaniu badaczom przydatnych zasobów oraz w jaki sposób badacze mogą współpracować z instytucjami dziedzictwa kulturowego w celu wzbogacenia swoich zasobów.
Dowiedz się więcej
Grupa zadaniowa APOLLONIS jest jednym z projektów dotyczących zasobów cyfrowych II wojny światowej, który zostanie omówiony podczas seminarium internetowego zorganizowanego przez Athena RC w dniu 10 września 2020 r. w ramach współpracy z Europeana Research 2018–2020. Zapoznaj się z programem i zarejestruj się!
