Συγκέντρωση συνδεδεμένων δεδομένων
Τα συνδεδεμένα δεδομένα είναι ένας τρόπος δημοσίευσης δομημένων δεδομένων στο διαδίκτυο που επιτρέπει τη σύνδεση και τον εμπλουτισμό των μεταδεδομένων. Αυτό διασφαλίζει ότι μπορούν να βρεθούν διαφορετικές αναπαραστάσεις του ίδιου περιεχομένου και να δημιουργηθούν σύνδεσμοι μεταξύ των σχετικών πόρων. Η συγκέντρωση συνδεδεμένων δεδομένων έχει τη δυνατότητα να αποφέρει οφέλη ως προς το κόστος και να βελτιώσει τη διαλειτουργικότητα των δεδομένων σε παγκόσμια κλίμακα, ενώ το έργο Europeana Common Culture διερεύνησε τη σκοπιμότητα της χρήσης των εν λόγω συνδεδεμένων δεδομένων για τη συγκέντρωση.
Η Europeana εφαρμόζει ήδη ένα κλιμακούμενο και βιώσιμο μοντέλο συγκέντρωσης μεταδεδομένων για τον τομέα της πολιτιστικής κληρονομιάς. Η συγκέντρωση συνδεδεμένων δεδομένων θα σήμαινε ότι οι πάροχοι δεδομένων θα μπορούσαν ευκολότερα να ανταλλάσσουν τα μεταδεδομένα τους με φορείς συγκέντρωσης πολιτιστικής κληρονομιάς που κάνουν χρήση συνδεδεμένων δεδομένων. Για τους παρόχους που δεν δημοσιεύουν ακόμη συνδεδεμένα δεδομένα, η εφαρμογή τους για συμμετοχή στην Europeana θα τους παρέχει επίσης το πλεονέκτημα ότι μπορούν να χρησιμοποιούν τα συνδεδεμένα δεδομένα τους για άλλες εφαρμογές, καθώς και με άλλους τομείς πέραν της πολιτιστικής κληρονομιάς, όπως οι μηχανές αναζήτησης στο διαδίκτυο.
Συνεργασία με παρόχους δεδομένων
Το πιλοτικό αυτό πρόγραμμα διήρκεσε από τον Μάιο του 2019 έως τον Ιούνιο του 2020. Συντονίστηκε από το Ολλανδικό Ινστιτούτο Ήχου και Οράματος (NISV) και παραδόθηκε σε στενή συνεργασία με το Ολλανδικό Δίκτυο Ψηφιακής Κληρονομιάς (NDE), το οποίο υποστήριξε το έργο παρέχοντας γνώση, λογισμικό και υποδομή για τη διεξαγωγή των δοκιμών. Στο πιλοτικό πρόγραμμα συμμετείχαν τρεις τύποι συμμετεχόντων στο οικοσύστημα της Europeana: πάροχοι δεδομένων, φορείς συγκέντρωσης και το Ίδρυμα Europeana. Δώδεκα πάροχοι δεδομένων συμμετείχαν στο πιλοτικό πρόγραμμα, αλλά δεν είχαν όλοι πλήρη επίγνωση των τεχνικών προκλήσεων που θα συνεπαγόταν αυτή η νέα προσέγγιση. Τέσσερις από τους παρόχους δεν ήταν σε θέση να παραδώσουν ένα σύνολο δεδομένων ως συνδεδεμένα δεδομένα, ενώ δύο άλλοι πάροχοι παρέδωσαν σύνολα δεδομένων με ανεπαρκή δεδομένα για συγκέντρωση στην Europeana.
Στις έξι επιτυχείς περιπτώσεις, πέντε πάροχοι διέθεταν ήδη εσωτερική γνώση ή υφιστάμενη εφαρμογή συνδεδεμένων δεδομένων, και για μία, ήταν η πρώτη της προσπάθεια για τη δημοσίευση συνδεδεμένων δεδομένων. Το συμπέρασμά μας είναι ότι υπάρχει μεγάλο ενδιαφέρον για την εφαρμογή συνδεδεμένων δεδομένων μεταξύ των παρόχων δεδομένων. Ωστόσο, απαιτεί σημαντικό επίπεδο πόρων όταν ένας οργανισμός δεν διαθέτει προηγούμενη εμπειρία.
Πιλοτικά αποτελέσματα
Το δοκιμαστικό σχέδιο εφάρμοσε μια προσέγγιση για τη συγκέντρωση συνδεδεμένων δεδομένων με βάση δύο προδιαγραφές για την παροχή ενός συνδεδεμένου συνόλου δεδομένων για την Europeana. Προηγουμένως ήταν επιτυχείς για ένα πιλοτικό έργο μικρής κλίμακας στο πλαίσιο του σχεδίου «Ανάπτυξη του αλφαβητισμού».
Η πρώτη προδιαγραφή είναι ότι τα μεταδεδομένα σε επίπεδο συνόλου δεδομένων θα πρέπει να παρέχονται με τη χρήση γνωστών λεξιλογίων. Περιλαμβάνει τα είδη των διανομών συνόλων δεδομένων που μπορούν να χρησιμοποιήσουν οι πάροχοι δεδομένων και τα απαιτούμενα μεταδεδομένα για κάθε μία.
Μια δεύτερη προδιαγραφή αφορά τη χρήση δεδομένων συνδεδεμένων με το Schema.org για την περιγραφή αντικειμένων πολιτιστικής κληρονομιάς σύμφωνα με τις απαιτήσεις της Europeana και του μοντέλου δεδομένων της Europeana (EDM). Επί του παρόντος, η Europeana υποστηρίζει μόνο την κατάποση μεταδεδομένων στο EDM. Ωστόσο, πειράματα για την εφαρμογή του Schema.org σε περιγραφές μεταδεδομένων αντικειμένων πολιτιστικής κληρονομιάς έχουν δείξει ότι μπορεί να παρέχει δεδομένα καλής ποιότητας, τα οποία είναι ικανά να εκπληρώσουν τις απαιτήσεις της Europeana. Αυτή η προδιαγραφή παρέχει ένα γενικό επίπεδο καθοδήγησης για τη χρήση των μεταδεδομένων Schema.org που, μετά τη μετατροπή σε EDM, θα οδηγήσουν σε μεταδεδομένα που είναι κατάλληλα για συγκέντρωση από την Europeana.
Το εν λόγω πιλοτικό έργο είχε επίσης ως αποτέλεσμα ένα σύνολο εργαλείων για τη συγκέντρωση συνδεδεμένων δεδομένων, το οποίο έχει σχεδιαστεί για χρήση από τους φορείς συγκέντρωσης και τους φορείς συγκέντρωσης άλλων παρόμοιων δικτύων της Europeana. Παρόλο που η λειτουργικότητα του συνόλου εργαλείων είναι προσαρμοσμένη για το EDM, οι συσσωρευτές που χρησιμοποιούν άλλα μοντέλα δεδομένων μπορούν να προσθέσουν τις δικές τους μετατροπές και επικυρώσεις χρησιμοποιώντας τα πρότυπα που εφαρμόζονται από το σύνολο εργαλείων. Το σύνολο εργαλείων βασίζεται σε περιέκτες Docker που διατηρούν την τεχνική ανεξαρτησία των εργαλείων του, καθιστώντας τη λύση φορητή σε διαφορετικά περιβάλλοντα και κλιμακούμενη, δίνοντας τη δυνατότητα εφαρμογής του σε μικρές ή μεγάλες συλλογές. Το σύνολο εργαλείων και ο πηγαίος κώδικας του είναι διαθέσιμα στο Github.
Μελλοντικές εργασίες
Προσδιορίστηκαν ορισμένοι τομείς για μελλοντικές εργασίες. Οι πάροχοι δεδομένων θα επωφεληθούν από εργαλεία για την προετοιμασία των συνδεδεμένων δεδομένων τους. Τα εργαλεία επικύρωσης που εφαρμόζονται στο σύνολο εργαλείων μπορούν επίσης να χρησιμοποιηθούν για τη δημιουργία υπηρεσιών για παρόχους δεδομένων, επιτρέποντάς τους να ελέγχουν την εγκυρότητα των δεδομένων τους σε προηγούμενα στάδια της δημοσίευσης συνδεδεμένων δεδομένων. Ένα πρώτο βήμα προς την κατεύθυνση αυτή πραγματοποιήθηκε με τη δοκιμή των συγκεντρωτικών συνδεδεμένων δεδομένων με τη χρήση του Europeana Metis Sandbox. Μια δεύτερη γραμμή εργασίας που θα ξεκινήσει το 2021 θα επικεντρωθεί στις συνιστώσες για τη διαλειτουργικότητα και την ενσωμάτωση της δέσμης εργαλείων στα συστήματα των φορέων συγκέντρωσης. Το έργο αυτό θα συντονίζεται από το Ολλανδικό Ινστιτούτο Ήχου και Οράματος στο ολλανδικό εθνικό έργο Digitale Collectie.
Για να μάθετε περισσότερα σχετικά με τα συνδεδεμένα δεδομένα, παρακολουθήστε το διαδικτυακό μας σεμινάριο από τον Οκτώβριο του 2020 σχετικά με το LODA - τον Συνδεδεμένο Συσσωρευτή Ανοικτών Δεδομένων, και αν ενδιαφέρεστε για το θέμα και θέλετε περισσότερες ευκαιρίες να το συζητήσετε, γίνετε μέλος της κοινότητας EuropeanaTech.
Η δημοσίευση αυτή τροποποιήθηκε στις 21 Ιανουαρίου 2021 για να επικαιροποιηθούν οι λεπτομέρειες των μελλοντικών προγραμματισμένων εργασιών σε αυτόν τον τομέα.
