Informationen zu APOLLONIS
Im Rahmen der griechischen Infrastruktur für die Erforschung und Innovation digitaler Künste, Geisteswissenschaften und Sprachen arbeitet APOLLONIS, eine benannte Task Force unter der Leitung von ATHENA R.C., daran, den Bedarf von Forschern beim Zugang zu unterschiedlichen Archiven zu ermitteln und zu unterstützen. Es konzentriert sich auf Archivmaterial aus dem Jahrzehnt der 1940er Jahre, einer turbulenten Periode in der griechischen Geschichte aufgrund ihrer bedeutenden Ereignisse (Zweiter Weltkrieg, Besatzung, Opposition, Befreiung, Bürgerkrieg), und hat digitalisierte historische Archive verschiedener Anbieter zusammengestellt, um verschiedene historische Aspekte dieser Ereignisse zu beleuchten.
Die Task Force verfolgt zwei Hauptziele:
- Entwerfen und Entwickeln eines gemeinsamen Repositorys für Metadaten und Indizes für Personen, Organisationen, Orte, Zeiten, Themen und Veranstaltungen, damit Personen Inhalte in verschiedenen Archiven durchsuchen können
- Definition von digitalen Kurationsaktivitäten und -workflows, damit die Arbeit zur Entwicklung des Repositorys repliziert werden kann und die weitere Analyse und Verarbeitung der angereicherten Inhalte unterstützt wird.
Der Task Force, die noch im Gange ist, gehören Mitglieder von ATHENA R.C., Koordinator von APOLLONIS, der Akademie von Athen, FORTH, dem Institut für Kommunikation und Computersysteme/NTUA und der Athens School of Fine Arts an.
Zusammenführen von Archiven - der Prozess
Die Aktivitäten der Task Force sind interdisziplinär und vielfältig. Von der Zusammenführung von Ressourcen bis hin zum Angebot in einer neuen Form für Forscher zeichnen wir unsere Arbeitsabläufe auf. Dazu gehören der initiale Kuratierungsprozess der digitalisierten Archive, die Aufnahme, die gemeinsame Indexierung der Daten, die Generierung semantischer Graphendarstellungen und schließlich deren Veröffentlichung. Im Folgenden beschreiben wir die Prozesse, die die Task Force durchlaufen hat, um dies zu erreichen.
Nachdem wir die Ausgangsmaterialien beschafft hatten, untersuchten wir deren Struktur und Inhalt, um verschiedene Archivmetadaten auf ein gemeinsames Metadatenschema abzubilden und so eine gemeinsame Indizierung und semantische Verknüpfungen in Archivinhalten zu ermöglichen. Das gemeinsame Metadatenschema ist eine angereicherte Version des Europeana Data Model (EDM).
Der nächste Schritt war die Datenbereinigung, bei der „schmutzige“ Daten, die Schreibfehler und ungültige oder falsche Werte enthielten, korrigiert wurden. Wir haben dann die Datensätze verbessert, indem wir zusätzliche Informationen identifiziert und in den Aufzeichnungen kommentiert haben - diese Informationen beziehen sich hauptsächlich auf Personen, Orte, bewaffnete Einheiten, Daten und wiederkehrende Themen, und wir profitierten daher von Natural Language Processing (NLP) -Techniken. Zu den Herausforderungen gehören unterschiedliche Inhaltsformate und -schemata, Variationen in Vokabeln und Terminologien, Inkonsistenzen bei der Standardisierung von Inhalten innerhalb derselben Sammlung und über Sammlungen hinweg sowie Rechtschreib- und Typografiefehler, die Verwendung griechischer und lateinischer Zeichen, Abkürzungen und Deklinationen.
Die resultierenden Dateien wurden im XML-Format ausgedrückt und aggregiert. Dieser Strukturierungsprozess lässt Raum für eine weitere Bereicherung durch mit dem Thema vertraute Forscher. Aber unser primäres Ziel ist es, komplexe Forschungsanfragen zu unterstützen. Zu diesem Zweck wurden die Daten schließlich durch die Verknüpfung verschiedener Quellen organisiert.
Die Sofortpläne der Taskforce umfassen die vollständige Aufnahme und Indexierung des Materials aus einer Reihe von Archiven, um einen entsprechenden semantischen Graphen zu erstellen. Die Aufnahme neuer Archive wäre die natürliche Fortsetzung unserer Arbeit, und weitere Kooperationen wären willkommen.
Verbesserte Archive zur Unterstützung der Forschung
Diese laufenden Arbeiten werden die derzeitige Nutzererfahrung verbessern, indem der Zugang zu Inhalten auf neue und innovative Weise erleichtert und Fragen der Erhaltung angegangen werden. Forscher, die APOLLONIS verwenden, müssen nicht in sechs verschiedenen Archiven suchen oder Probleme im Zusammenhang mit der Chronologie der Elemente oder der Art und Weise, wie sie aufgezeichnet wurden, haben.
Wenn unsere Arbeit abgeschlossen ist, können die Forscher gleichzeitig auf verschiedene Archive und angereicherte Ressourcen zugreifen. Sie werden auch in der Lage sein, im Rahmen des Projekts entwickelte Curation- und Content-Analyse-Workflows zu nutzen. Das Projekt zeigt und reflektiert daher, wie die digitale Kuration ein Zwischenschritt sein kann, um Forschern nützliche Ressourcen zur Verfügung zu stellen, und wie Forscher mit Einrichtungen des Kulturerbes zusammenarbeiten können, um ihre Ressourcen zu bereichern.
Erfahren Sie mehr
Die APOLLONIS Task Force ist eines der Projekte zu digitalen Ressourcen des Zweiten Weltkriegs, das in einem Webinar erörtert wird, das von Athena RC am 10. September 2020 im Rahmen seiner Zusammenarbeit mit Europeana Research 2018-2020 organisiert wird. Entdecken Sie das Programm und registrieren Sie sich!
