Σχετικά με APOLLONIS
Στο πλαίσιο της ελληνικής υποδομής για τις ψηφιακές τέχνες, τις ανθρωπιστικές επιστήμες και τη γλωσσική έρευνα και καινοτομία, η APOLLONIS, ειδική ομάδα υπό την ηγεσία του ATHENA R.C., εργάζεται για τον εντοπισμό και την υποστήριξη των αναγκών των ερευνητών κατά την πρόσβαση σε ανόμοια αρχεία. Επικεντρώνεται σε αρχειακό υλικό από τη δεκαετία του 1940, μια ταραχώδη περίοδο στην ελληνική ιστορία λόγω των σημαντικών γεγονότων της (Β 'Παγκόσμιος Πόλεμος, Κατοχή, Αντιπολίτευση, Απελευθέρωση, Εμφύλιος Πόλεμος), και έχει συγκεντρώσει ψηφιοποιημένα ιστορικά αρχεία από διάφορους παρόχους για να ρίξει φως σε διαφορετικές ιστορικές πτυχές αυτών των γεγονότων.
Η ειδική ομάδα έχει δύο κύριους στόχους:
- Σχεδιασμός και ανάπτυξη κοινού αποθετηρίου μεταδεδομένων και ευρετηρίων για άτομα, οργανισμούς, τόπους, χρόνους, θέματα και εκδηλώσεις, ώστε να μπορούν τα άτομα να αναζητούν περιεχόμενο σε διάφορα αρχεία
- Καθορισμός δραστηριοτήτων ψηφιακής επιμέλειας και ροών εργασίας, έτσι ώστε οι εργασίες που λαμβάνονται για την ανάπτυξη του αποθετηρίου να μπορούν να αναπαραχθούν και να υποστηρίξουν την περαιτέρω ανάλυση και επεξεργασία του εμπλουτισμένου περιεχομένου.
Η Ομάδα Δράσης, η οποία βρίσκεται ακόμη σε εξέλιξη, περιλαμβάνει μέλη του Ε.Κ. ΑΘΗΝΑ, συντονιστή του ΑΠΟΛΛΩΝΗ, της Ακαδημίας Αθηνών, του ΙΤΕ, του Ινστιτούτου Συστημάτων Επικοινωνιών και Υπολογιστών/ΕΜΠ και της Ανωτάτης Σχολής Καλών Τεχνών της Αθήνας.
Συγκέντρωση αρχείων - η διαδικασία
Οι δραστηριότητες της ειδικής ομάδας είναι διεπιστημονικές και ποικίλες. Από τη συγκέντρωση πόρων έως την προσφορά τους σε μια νέα μορφή στους ερευνητές, καταγράφουμε τις ροές εργασίας μας. Περιλαμβάνουν την αρχική διαδικασία επιμέλειας των ψηφιοποιημένων αρχείων, την κατάποση, την κοινή ευρετηρίαση των δεδομένων, την παραγωγή σημασιολογικών γραφικών αναπαραστάσεων και, τέλος, τη δημοσίευσή τους. Παρακάτω, αναλύουμε λεπτομερώς τις διαδικασίες που πέρασε η Task Force για να το επιτύχει αυτό.
Αφού αποκτήσαμε το αρχικό υλικό, διερευνήσαμε τη δομή και το περιεχόμενό τους, προκειμένου να χαρτογραφήσουμε διαφορετικά μεταδεδομένα αρχείου σε ένα κοινό σχήμα μεταδεδομένων, επιτρέποντας την κοινή ευρετηρίαση και την καθιέρωση σημασιολογικών δεσμών στο αρχειακό περιεχόμενο. Το κοινό σχήμα μεταδεδομένων είναι μια εμπλουτισμένη έκδοση του μοντέλου δεδομένων Europeana (EDM).
Το επόμενο βήμα ήταν ο καθαρισμός των δεδομένων, όπου διορθώθηκαν «βρώμικα» δεδομένα που περιλάμβαναν τυπογραφικά σφάλματα και μη έγκυρες ή εσφαλμένες τιμές. Στη συνέχεια, ενισχύσαμε τα σύνολα δεδομένων εντοπίζοντας πρόσθετες πληροφορίες και σημειώνοντάς τις στα αρχεία - αυτές οι πληροφορίες σχετίζονται κυρίως με ανθρώπους, τόπους, ένοπλες μονάδες, ημερομηνίες και επαναλαμβανόμενα θέματα και, ως εκ τούτου, επωφεληθήκαμε από τις τεχνικές επεξεργασίας φυσικής γλώσσας (NLP). Οι προκλήσεις που αντιμετωπίζονται περιλαμβάνουν διαφορετικές μορφές και σχήματα περιεχομένου, παραλλαγές λεξιλογίων και ορολογιών, ασυνέπειες στην τυποποίηση περιεχομένου εντός της ίδιας συλλογής και μεταξύ συλλογών, καθώς και ορθογραφικά και τυπογραφικά λάθη, χρήση ελληνικών και λατινικών χαρακτήρων, συντομογραφίες και αποκλίσεις.
Τα αρχεία που προέκυψαν εκφράστηκαν σε μορφή XML και συγκεντρώθηκαν. Αυτή η διαδικασία διάρθρωσης αφήνει περιθώρια για περαιτέρω εμπλουτισμό από ερευνητές εξοικειωμένους με το θέμα. Αλλά πρωταρχικός μας στόχος είναι να υποστηρίξουμε πολύπλοκα ερευνητικά ερωτήματα. Για τον σκοπό αυτό, τα δεδομένα οργανώθηκαν τελικά με τη σύνδεση διαφόρων πηγών.
Τα άμεσα σχέδια της ειδικής ομάδας περιλαμβάνουν την πλήρη κατάποση και ευρετηρίαση του υλικού από διάφορα αρχεία για την παραγωγή αντίστοιχου σημασιολογικού γραφήματος. Η ενσωμάτωση νέων αρχείων θα ήταν η φυσική συνέχεια του έργου μας και περαιτέρω συνεργασίες θα ήταν ευπρόσδεκτες.
Βελτιωμένα αρχεία για την υποστήριξη της έρευνας
Αυτό το συνεχιζόμενο έργο θα βελτιώσει την τρέχουσα εμπειρία των χρηστών διευκολύνοντας την πρόσβαση σε περιεχόμενο με νέους και καινοτόμους τρόπους, εκτός από την αντιμετώπιση ζητημάτων διατήρησης. Οι ερευνητές που χρησιμοποιούν το APOLLONIS δεν θα χρειαστεί να ψάξουν σε έξι διαφορετικά αρχεία ή να αντιμετωπίσουν ζητήματα που σχετίζονται με τη χρονολογία των αντικειμένων ή με τους τρόπους με τους οποίους είχαν καταγραφεί.
Όταν ολοκληρωθεί το έργο μας, οι ερευνητές θα μπορούν να έχουν πρόσβαση σε διαφορετικά αρχεία και εμπλουτισμένους πόρους ταυτόχρονα. Θα μπορούν επίσης να χρησιμοποιούν ροές εργασιών επιμέλειας και ανάλυσης περιεχομένου που αναπτύσσονται στο πλαίσιο του έργου. Ως εκ τούτου, το έργο καταδεικνύει και αντικατοπτρίζει τον τρόπο με τον οποίο η ψηφιακή επιμέλεια μπορεί να αποτελέσει ενδιάμεσο βήμα για την προσφορά χρήσιμων πόρων στους ερευνητές και τον τρόπο με τον οποίο οι ερευνητές μπορούν να συνεργαστούν με ιδρύματα πολιτιστικής κληρονομιάς για τον εμπλουτισμό των πόρων τους.
Μάθετε περισσότερα
Το APOLLONIS Task Force είναι ένα από τα έργα για τους ψηφιακούς πόρους του Β 'Παγκοσμίου Πολέμου που θα συζητηθούν σε διαδικτυακό σεμινάριο που διοργανώνει το ΕΚ Αθηνά στις 10 Σεπτεμβρίου 2020 στο πλαίσιο της συνεργασίας του με την Europeana Research 2018-2020. Εξερευνήστε το πρόγραμμα και εγγραφείτε!
