Διαβάστε παρακάτω για μια ματιά σε ένα αναπαραγώγιμο πιλοτικό πρόγραμμα που συνδύασε τη χρήση της πλατφόρμας Europeana.eu και των API, τα προεκπαιδευμένα μοντέλα ΤΝ, τη μοντελοποίηση ζωντανού κώδικα και σημασιολογικών δεδομένων, τους ανθρώπινους συνεισφέροντες σε μια πλατφόρμα πληθοπορισμού, ένα εργαλείο θησαυρού με επίγνωση προκατάληψης και μετρήσεις δεδομένων, οι οποίες οδήγησαν στον εμπλουτισμό μιας ουκρανικής εθνογραφικής συλλογής στο Europeana.eu μέσω 55.000 δράσεων σχολιασμού και σχεδόν 6.000 νέων ετικετών μεταδεδομένων.
Διασφάλιση της ουκρανικής κληρονομιάς με πρωτοβουλία των πολιτών
Από το 2025, το Web2Learn —από κοινού με τα πανεπιστήμια του Λουξεμβούργου, της Λετονίας, του Κιέβου, του Taras Shevchenko και του Ιδρύματος Europeana— συνεργάζεται για το AISTER, ένα έργο Erasmus+ που αφορά τη συμμετοχή των πολιτών με δυνατότητα ΤΝ στη διαφύλαξη της ουκρανικής πολιτιστικής κληρονομιάς. Το Web2Learn συνεισφέρει την τεχνογνωσία του στην καινοτομία με γνώμονα τον πολίτη στο έργο χρησιμοποιώντας τεχνολογίες ανοιχτού κώδικα που προωθούν την εκπαίδευση, την κατάρτιση και την ενεργό συμμετοχή στα κοινά.

HITL Crowdsourcing Pilot Poster by Web2Learn ενσωματώνει τη Λαϊκή Ζωγραφική "Πορτρέτο κοριτσιού" όπως αποδόθηκε παραπάνω, ενσωματωμένη στην παρούσα σύνθεση με πρόσθετη άδεια από τον κάτοχο των δικαιωμάτων.
Η κοινοπραξία AISTER έχει προβλέψει μια σειρά εργαστηρίων με τη συμμετοχή ερευνητών, φοιτητών και νέων επαγγελματιών κατά τη διάρκεια του έργου. Πέντε εργαστήρια με επικεφαλής το Web2Learn διαδικτυακά και επιτόπου στη Βιβλιοθήκη του Πανεπιστημίου της Λετονίας έδωσαν την ευκαιρία να διεξαχθεί πιλοτική εφαρμογή: να δοκιμάσουν μια ροή εργασίας «human-in-the-loop» για τον εμπλουτισμό των ψηφιακών συλλογών εικόνων μέσω πληθοπορισμού και εργαλείων ΤΝ, καλώντας τους συμμετέχοντες στο εργαστήριο να ασχοληθούν με την ουκρανική εθνογραφική κληρονομιά και να καταστούν ενεργοί συνεισφέροντες μέσω του εμπλουτισμού και της επικύρωσης ετικετών περιγραφής που παράγονται από την ΤΝ.
Το πιλοτικό έργο σχεδιάστηκε ως ένας ανοικτός και αναπαραγώγιμος πόρος με λεπτομερή τεκμηρίωση για τη διευκόλυνση της έρευνας και της κατάρτισης στις ψηφιακές ανθρωπιστικές επιστήμες και διατίθεται δωρεάν για επαναχρησιμοποίηση από μελετητές, σπουδαστές και εκπαιδευτικούς, καθώς και για δημιουργική επαναχρησιμοποίηση.
Ουκρανική λαϊκή τέχνη στο Europeana.eu
Το 2025 το διαδικτυακό μουσείο παραδοσιακής τέχνης Krovets της Ουκρανίας, το οποίο λειτουργεί από το 2014 χάρη στις εθελοντικές προσπάθειες των ιδρυτών του μουσείου, δημοσίευσε ένα σύνολο δεδομένων στο Europeana.eu μέσω του συσσωρευτή MUSEU, το οποίο περιλαμβάνει 3.840 αντικείμενα εθνογραφικής κληρονομιάς, συμπεριλαμβανομένων παραδοσιακών ενδυμασιών, υφαντουργικών τεχνών, λαϊκής τέχνης, υλικού πολιτισμού και φωτογραφιών.
Οι εικόνες που χρησιμοποιήθηκαν για τον πιλότο προέρχονται από αυτή την εθνογραφική συλλογή. Στο πλαίσιο του πιλοτικού έργου, δημοσιεύθηκε στο Europeana.eu μια γκαλερί ουκρανικής λαϊκής τέχνης, η οποία παρέχει πρόσβαση στην υποσυλλογή λαϊκής τέχνης του μουσείου, η οποία περιλαμβάνει 312 αντικείμενα που ταξινομούνται ως λαϊκοί πίνακες ή λαϊκές εικόνες. Οι περισσότεροι πίνακες, που απεικονίζουν την καθημερινή αγροτική ζωή, λαογραφικά και θρησκευτικά θέματα, προέρχονται από τις κεντρικές εθνογραφικές περιοχές της Ουκρανίας, τη Μέση Ποδνιπρόβια και την Πολταβσχίνα και χρονολογούνται κυρίως στις αρχές και τα μέσα του εικοστού αιώνα.
Η συλλογή αποτελείται κυρίως από σκηνές, τοπία και μεμονωμένα πορτρέτα. Οι λαϊκές ζωγραφιές σχηματίζουν εικαστικές αφηγήσεις, προσφέροντας στιγμιότυπα αγροτικών τοπίων, θρησκευτικών παραδόσεων, μοτίβων λαϊκής τέχνης και καθημερινού υλικού πολιτισμού. Πολλές από τις λεπτομέρειες είναι εύκολο να παρατηρηθούν κατά την εξέταση των εικόνων, αλλά δεν είναι πάντα εύκολο να ανακαλυφθούν μέσω της αναζήτησης.
Ο άνθρωπος-in-the-loop crowdsourcing πιλότος
Το πιλοτικό έργο αποσκοπούσε στη δημιουργία ενός νέου επιπέδου προβολής της ουκρανικής λαϊκής τέχνης. Ανέπτυξε μια ροή εργασίας που συνδυάζει τη χρήση των API της Europeana, τις μεθόδους που βασίζονται στην ΤΝ για την επεξεργασία φυσικής γλώσσας και την υπολογιστική όραση, το Jupyter Notebook ως διαδραστικό χώρο εργασίας για αναπαραγώγιμη κωδικοποίηση και την επεξεργασία δεδομένων με βάση τη δεοντολογία, σε συνδυασμό με τη δημόσια συμμετοχή μέσω της πλατφόρμας πληθοπορισμού CrowdHeritage για τη δημιουργία ετικετών περιγραφής με δυνατότητα αναζήτησης, επικυρωμένων από τον άνθρωπο και ηθικά αξιολογημένων εν γένει.
Για να ξεκινήσετε, χρησιμοποιήθηκαν δύο API της Europeana για τη συλλογή των στοιχείων και των μεταδεδομένων της συλλογής, το API συνόλου χρηστών της Europeana για την πρόσβαση σε συλλογές που δημιουργούνται από χρήστες που δημοσιεύονται στην Europeana και το API αναζήτησης της Europeana για την ανάκτηση μεταδεδομένων του περιεχομένου που είναι προσβάσιμο στην Europeana, σύμφωνα με το μοντέλο δεδομένων της Europeana (EDM). Στη συνέχεια, δημιουργήθηκαν νέοι περιγραφικοί σχολιασμοί με εργαλεία τεχνητής νοημοσύνης που χρησιμοποιούσαν προεκπαιδευμένα μοντέλα τεχνητής νοημοσύνης ανοικτού κώδικα και βιβλιοθήκες στην επεξεργασία φυσικής γλώσσας και στην υπολογιστική όραση. Οι αυτοματοποιημένοι σχολιασμοί δημιουργήθηκαν στα σημειωματάρια Jupyter και σειριοποιήθηκαν στο JSON-LD σύμφωνα με το Web Annotation Data Model του W3C (World Wide Web Consortium), για να υποστηρίξουν την εισαγωγή τους στην πλατφόρμα πληθοπορισμού CrowdHeritage που διατηρεί η Datoptron.
Συνολικά, ο πιλότος ανέπτυξε οκτώ σημειωματάρια Jupyter, τα οποία λειτούργησαν ως διαδραστικά υπολογιστικά περιβάλλοντα που επιτρέπουν τη ζωντανή κωδικοποίηση και την αναπαραγωγιμότητα για την υποστήριξη της διατερματικής εκτέλεσης των βημάτων επεξεργασίας δεδομένων. Οι φορητοί υπολογιστές υλοποιήθηκαν στο Google Colab για να επιτρέψουν τη συνεργασία και τη συν-επεξεργασία σε πραγματικό χρόνο και στη συνέχεια μεταφέρθηκαν ως ανοιχτό αποθετήριο στο GitHub για έλεγχο εκδόσεων, διευκολύνοντας τη διαφάνεια και την ιχνηλασιμότητα της βελτιστοποίησης του κώδικα συνεργασίας. Καλύπτουν την πλήρη διαδικασία δεδομένων του πιλότου σε διαδοχικά βήματα, τα οποία περιλαμβάνουν:
Βήμα 1: Αυτόματη δημιουργία σχολίων από μεταδεδομένα κειμένου (βάσει NLP)
1θ. Ανάκτηση των αναγνωριστικών αντικειμένων εντός της δημοσιευμένης Πινακοθήκης ουκρανικής λαϊκής τέχνης με χρήση του συνόλου χρηστών ΑPI της Europeana και λήψη μεταδεδομένων κειμένου (π.χ. τίτλοι, θέματα) των αντικειμένων με χρήση του API αναζήτησης της Europeana.
1ii. Δημιουργήστε αυτοματοποιημένους σχολιασμούς (ετικέτες περιγραφής) από τα μεταδεδομένα χρησιμοποιώντας τεχνικές επεξεργασίας φυσικής γλώσσας (NLP), ιδιαίτερα ευρετικούς κανόνες και αναγνώριση ονομάτων οντοτήτων (NER) χρησιμοποιώντας το spaCy βιβλιοθήκης Python ανοιχτού κώδικα.
Βήμα 2: Αυτοματοποιημένη παραγωγή σχολιασμού από εικόνες (βάσει όρασης υπολογιστή)
2θ. Κατεβάστε τα αντικείμενα της γκαλερί ως εικόνες χρησιμοποιώντας το API του συνόλου χρηστών της Europeana.
2ii. Δημιουργία περιγραφικών λεζάντων εικόνας με τη χρήση τεχνικών υπολογιστικής όρασης με προεκπαιδευμένα μοντέλα ΤΝ, ιδίως παραλλαγές των μοντέλων Qwen ανοικτού κώδικα — πολυτροπικό μοντέλο οπτικής γλώσσας Qwen3-VL-2B-Instruct (VLM) και μεγάλο γλωσσικό μοντέλο Qwen3.5-4B (LLM).
2iii. Δημιουργήστε αυτοματοποιημένα σχόλια από τις λεζάντες της εικόνας.
Βήμα 3: Προετοιμασία αυτοματοποιημένων σχολιασμών για επικύρωση μέσω πληθοπορισμού (μορφοποίηση JSON-LD)
3θ. Μορφοποίηση όλων των παραγόμενων σχολίων με βάση το μοντέλο σχολιασμού του W3C για άμεση κατάποση στην πλατφόρμα πληθοπορισμού CrowdHeritage.
3ii. Μετατρέψτε τα τελικά σχόλια σε ένα μηχαναγνώσιμο CSV και συνδυάστε όλα τα σχόλια από τα πέντε εργαστήρια πληθοπορισμού.
Στάδιο 4: Διασφάλιση της ποιότητας των δεδομένων και έλεγχος μεροληψίας των επιβεβαιωμένων από τον άνθρωπο σχολίων
4θ. Ελέγξτε τις τελικές παρατηρήσεις ενάντια σε επιβλαβείς, προκατειλημμένους ή αμφιλεγόμενους όρους στο λεξιλόγιο DE-BIAS μέσω του RDF-based thesaurus querying.

Κατά τη διάρκεια πέντε εργαστηρίων πληθοπορισμού που πραγματοποιήθηκαν επιτόπου και διαδικτυακά, 70 συμμετέχοντες, συμπεριλαμβανομένων ερευνητών, φοιτητών πανεπιστημίου και εμπειρογνωμόνων λαϊκής τέχνης, εξέτασαν σχολιασμούς που δημιουργήθηκαν από τεχνητή νοημοσύνη, επιβεβαιώνοντας ακριβείς ετικέτες, απορρίπτοντας παραπλανητικές μέσω αναψηφοφοριών και καταψηφίσεων και συνεισφέροντας επιπλέον δικές τους σχολιασμούς.
Διερεύνηση δεδομένων και δεοντολογική αξιολόγηση
Η πλειοψηφία των εικόνων εμπλουτίστηκε με 15 έως 20 νέες περιγραφικές ετικέτες η κάθε μία. Συνολικά, καταγράφηκαν σχεδόν 55.000 ενέργειες σχολιασμού, συμπεριλαμβανομένης της δημιουργίας ετικετών, των ανοδικών και των καθοδικών ψήφων. Το αποτέλεσμα είναι το άνοιγμα πλουσιότερων οδών για την ανακάλυψη και τη συμμετοχή στην ουκρανική λαϊκή τέχνη. Οι μετρήσεις μετά την εκστρατεία αποκαλύπτουν ότι οι περισσότεροι σχολιασμοί που παράγονται από τεχνητή νοημοσύνη έγιναν δεκτοί ως ακριβείς, με μόνο λίγους να απορρίπτονται.
Αυτές οι πέντε ετικέτες που παράγονται από ΤΝ έλαβαν τα υψηλότερα ποσοστά αποδοχής:
- εικονίδιο
- ζωγραφική
- άνθρωπος
- δένδρα
- γυναίκα.
Αυτές οι πέντε ετικέτες που δημιουργήθηκαν από ΤΝ έλαβαν τα υψηλότερα ποσοστά απόρριψης:
- ρωγμές
- ένδυση
- ζημία
- Μικρό αντικείμενο
- προσωπικό.
Η εφαρμογή δεοντολογικής εκτίμησης επιπτώσεων στις τελικές παρατηρήσεις αντιμετωπίστηκε ως σημαντικό βήμα στο πιλοτικό έργο. Διενεργήθηκε δεύτερο επίπεδο επανεξέτασης για τον εντοπισμό δυνητικά προβληματικής γλώσσας και την ενίσχυση της λογοδοσίας. Η εξέταση των εγκεκριμένων από τον άνθρωπο ετικετών έναντι του λεξιλογίου DE-BIAS προσδιόρισε έναν όρο, τον σκλάβο, ο οποίος στη συνέχεια αναθεωρήθηκε σε υποδουλωμένο άτομο σύμφωνα με τη σύσταση. Το λεξιλόγιο εφαρμόστηκε ως μέτρο εκτίμησης δεοντολογικών επιπτώσεων πριν από την τελική δημοσίευση του συνόλου ανοικτών δεδομένων, λαμβάνοντας υπόψη τη «Σύσταση της UNESCO για τη δεοντολογία της τεχνητής νοημοσύνης» (2022) και το εργαλείο «Εκτίμηση δεοντολογικών επιπτώσεων» (2023).
Η ανάπτυξη του πιλοτικού έργου και η κατανόηση των δεοντολογικών του διαστάσεων που σχετίζονται με την ΤΝ ενημερώθηκαν επίσης από τη μελέτη ανάλυσης δεδομένων AISTER, η οποία χαρτογράφησε 22 διεθνή ερευνητικά έργα που χρησιμοποιούν την τεχνητή νοημοσύνη και τη συμμετοχή των πολιτών για τη διατήρηση της πολιτιστικής κληρονομιάς σε καταστάσεις έκτακτης ανάγκης. Η μελέτη κατέταξε τα επιλεγμένα έργα χρησιμοποιώντας το πλαίσιο ταξινόμησης AISTER, το οποίο προσφέρει συστηματική κατηγοριοποίηση σε 24 αναλυτικές διαστάσεις που έχουν σχεδιαστεί για την ανάλυση πρωτοβουλιών συμμετοχικής κληρονομιάς που βασίζονται στην ΤΝ. Οι διαστάσεις του πλαισίου περιλαμβάνουν τους τομείς της πολιτιστικής κληρονομιάς, το μοντέλο συμμετοχής των πολιτών (Shirk et al., 2012) και το μοντέλο συνεργασίας (Carayannis & Campbell, 2009), παράλληλα με τις ειδικές διαστάσεις της ΤΝ, συμπεριλαμβανομένων των τύπων τεχνολογίας ΤΝ, του μοντέλου ορθολογικών παραγόντων (Russell & Norvig, 2020, 4η έκδοση), της εφαρμοσμένης δεοντολογικής τυπολογίας ΤΝ (Morley et al., 2019), των τύπων αδειών και άλλων. Τα στοιχεία της μελέτης δημοσιεύονται ως διαδραστικές απεικονίσεις ιστού ανοικτής πρόσβασης που προσφέρουν συγκριτική διερεύνηση του πεδίου. Η πιλοτική ροή εργασιών και τα ευρήματα δημοσιεύονται σε προσεχές έγγραφο του συνεδρίου (Ziku, Zourou, & Kouzelis, 2026).
Συμπεράσματα
Το δοκιμαστικό σχέδιο έθεσε ως στόχο τη δημιουργία μιας ανοικτής και αναπαραγώγιμης οδού για τη χρήση εργαλείων ΤΝ για την επεξεργασία δεδομένων σε κλίμακα, σε συνδυασμό με την ανθρώπινη συμμετοχή, τη δεοντολογική αξιολόγηση και τις γνώσεις σχετικά με τα δεδομένα, ώστε να υποστηριχθούν πιο ακριβείς, υπεύθυνοι, βασισμένοι σε μετρήσεις και εμπλουτισμένοι τρόποι ανακάλυψης της ουκρανικής λαϊκής τέχνης. Μερικές φορές το τυχαίο ταξίδι στην κληρονομιά ξεκινά με τη λέξη πληκτρολογημένη σε ένα πλαίσιο αναζήτησης. Και μερικές φορές, οι σωστές λέξεις μπορούν να φέρουν μια νέα συλλογή στο φως.
Οι τρεις πιο ενεργοί συνεισφέροντες στην εκστρατεία crowdsourcing έλαβαν τιμητική διάκριση καθώς και χρυσά, ασημένια και χάλκινα διακριτικά αντίστοιχα: Inna Kaika, φοιτήτρια Αγγλικής Γλώσσας και Ξένης Λογοτεχνίας, Κρατικό Πανεπιστήμιο Mykola Gogol· Daria Markova, φοιτήτρια Μετάφρασης, Κρατικό Τεχνικό Πανεπιστήμιο Pryazovskyi· Marko Lakhmatov, φοιτητής Κυβερνοασφάλειας, Κρατικό Τεχνικό Πανεπιστήμιο Pryazovskyi.
Αντανακλώντας τη συμμετοχή της, η Inna δήλωσε: «Η ουκρανική τέχνη αντικατοπτρίζει την ανθεκτικότητα και τη δημιουργικότητα του λαού μας και η ανταλλαγή της είναι πιο σημαντική από ποτέ. Καθοδηγούμενος από αυτό το πάθος, συμμετείχα στην εκστρατεία για να καταστήσω την πολιτιστική κληρονομιά πιο προσιτή. Μου άρεσε ιδιαίτερα η διαδικασία σχολιασμού και η εξερεύνηση της εθνογραφικής συλλογής. Ήταν τιμή μου να συμβάλω σε ένα έργο που συνδυάζει την τέχνη με την τεχνολογία.»
Εξερεύνηση και επαναχρησιμοποίηση των πιλοτικών πόρων
Ενδιαφέρεστε να εφαρμόσετε παρόμοιες μεθόδους στις δικές σας συλλογές;
- Δείτε την εκστρατεία πληθοπορισμού για την ουκρανική λαϊκή τέχνη στο CrowdHeritage.
- Εξερευνήστε το πιλοτικό πρόγραμμα πληθοπορισμού «human-in-the-loop».
- Επαναχρησιμοποίηση των σημειωματαρίων Jupyter ανοικτού κώδικα, τα οποία τεκμηριώνουν την πλήρη ροή εργασιών από την ανάκτηση δεδομένων έως τα σχόλια που παράγονται από ΤΝ και τις εξαγωγές που είναι έτοιμες για πλατφόρμα.
- Πρόσβαση στα ανοικτά σύνολα δεδομένων στο ανοικτό αποθετήριο του Zenodo, τα οποία περιλαμβάνουν τα δεδομένα και τα αποτελέσματα του πιλοτικού έργου για διατήρηση, παραπομπή και επαναχρησιμοποίηση.
- Εξερευνήστε τις διαδραστικές απεικονίσεις δεδομένων και ανακαλύψτε πληροφορίες από 22 διεθνείς ερευνητικές πρωτοβουλίες που χρησιμοποιούν την ΤΝ και τη συμμετοχή των πολιτών για τη διατήρηση της πολιτιστικής κληρονομιάς σε περιβάλλοντα έκτακτης ανάγκης και πέραν αυτών.
Επιβεβαιώσεις
Θα θέλαμε να ευχαριστήσουμε όλους τους εταίρους και τους συνεργάτες του έργου AISTER, και ιδιαίτερα τον Yevgen Dmytruk στο Μουσείο Krovets, την Ειρήνη Καλδέλη στο CrowdHeritage και το Datoptron, τον Hugo Manguinhas στο Ίδρυμα Europeana και τους Uldis Zariņš και Sanita Reinsone στο Πανεπιστήμιο της Λετονίας.
Επιλεγμένες αναφορές
- Η τεκμηρίωση των σημειωματαρίων Jupyter ακολουθεί τα κριτήρια αξιολόγησης της ποιότητας για τα έργα Jupyter από τα ιδρύματα GLAM, όπως δημοσιεύθηκαν στο Candela, G., Chambers, S., & Sherratt, T. (2023). Προσέγγιση για την αξιολόγηση της ποιότητας των έργων Jupyter που δημοσιεύονται από τα ιδρύματα GLAM. Εφημερίδα της Ένωσης για την Επιστήμη και την Τεχνολογία των Πληροφοριών, 74(13), 1550–1564.
- Η τεκμηρίωση README του πιλοτικού προγράμματος για το GitHub υιοθετεί τη δομή της τεκμηρίωσης του συνόλου δεδομένων που βασίζεται στο Git της KU Leuven Libraries. Βλέπε: KU Leuven Libraries, Τμήμα Ψηφιοποίησης. (2019). The Portraits Collection Dataset of KU Leuven Libraries, Special Collections (Version 01-beta2) [Σύνολο δεδομένων]. Ο Ζενόντο.
- M. Ziku, Κ. Ζούρου, και Α. Κουζέλης, 'AI-Assisted Metadata Enrichment for Ethnographic Heritage: A Reproducible Human-in-the-Loop Crowdsourcing Workflow», 2026 IEEE International Conference on Cyber Humanities (IEEE-CH), Βενετία, Ιταλία, 7-9 Σεπτεμβρίου 2026, στον Τύπο.