Μάρκο Ρεντίνα: Ειρήνη, ας ξεκινήσουμε από τα βασικά. Τι είναι το crowdsourcing;
Ειρήνη Καλδέλη: Ο πληθοπορισμός είναι η διαδικασία διανομής μιας εργασίας σε μια ομάδα ανθρώπων, οι οποίοι συνήθως συμβάλλουν μέσω της εργασίας τους στο διαδίκτυο. Σε ορισμένες περιπτώσεις, οι συνεισφέροντες λαμβάνουν υλική αποζημίωση· σε άλλους, η συμμετοχή τους είναι εθελοντική, ενώ οι ανταμοιβές είναι επουσιώδεις, όπως η προσωπική ικανοποίηση, η πολιτιστική συνεισφορά ή η απόκτηση γνώσεων. Στον τομέα της πολιτιστικής κληρονομιάς, ο πληθοπορισμός χρησιμοποιείται εδώ και καιρό για την αντιμετώπιση διαφόρων προκλήσεων, από τη συλλογή και τη μεταγραφή περιεχομένου έως την επισήμανση συλλογών και τον εντοπισμό μεροληπτικών όρων στην περιγραφή αντικειμένων πολιτιστικής κληρονομιάς. Ανάλογα με τη φύση της εργασίας, οι συμμετέχοντες μπορεί να χρειάζονται εξειδικευμένες δεξιότητες ή γνώσεις.
MR: Ποια είναι τα οφέλη του πληθοπορισμού για τον τομέα της πολιτιστικής κληρονομιάς;
ΕΚ : Ένα υπεύθυνο και ουσιαστικό έργο πληθοπορισμού μπορεί να αποφέρει αμοιβαία οφέλη σε ιδρύματα πολιτιστικής κληρονομιάς και συμμετέχοντες. Κατά πρώτο και κύριο λόγο, ο πληθοπορισμός θα πρέπει να προσεγγίζεται ως μέσο για τη συμμετοχή των πολιτών στις συλλογές πολιτιστικής κληρονομιάς. Αφενός, οι συμμετέχοντες έχουν την ευκαιρία να αλληλεπιδράσουν με την πολιτιστική κληρονομιά και να συνδεθούν μαζί της· να μάθουν χρήσιμες πληροφορίες σχετικά με αντικείμενα και θέματα με παιχνιδιάρικο τρόπο· μοιράζονται τις προοπτικές και τις γνώσεις τους· να συνδιαμορφώνουν τον τρόπο παρουσίασης των συλλογών· και να συνεργάζονται με τους συμπολίτες τους σε μια συμμετοχική εμπειρία. Από την άλλη πλευρά, τα ιδρύματα πολιτιστικής κληρονομιάς μπορούν να βελτιώσουν την ποιότητα των συλλογών τους και να τις καταστήσουν πιο ανιχνεύσιμες και προσβάσιμες· να αυξήσουν την ευαισθητοποίηση σχετικά με τα περιουσιακά στοιχεία πολιτιστικής κληρονομιάς τους· να προσεγγίσει νέα ακροατήρια· και να αποκτήσουν βαθύτερες γνώσεις σχετικά με τον τρόπο με τον οποίο οι συλλογές τους γίνονται αντιληπτές από τις κοινότητες.
MR: Σπύρο, θα μπορούσατε να μας πείτε λίγα λόγια για την πλατφόρμα CrowdHeritage στην οποία εργάζεστε στο πλαίσιο του έργου AI4Culture;
Σπύρος Μπεκιάρης: Το CrowdHeritage είναι μια ανοικτή πλατφόρμα για τη διοργάνωση διαδικτυακών εκστρατειών πληθοπορισμού που κινητοποιούν τους ανθρώπους για τη βελτίωση της ποιότητας των συλλογών πολιτιστικής κληρονομιάς. Αυτό θα μπορούσε να αφορά διάφορες πτυχές, από την πολύγλωσση κάλυψη έως τη σημασιολογική σήμανση. Οι συμμετέχοντες καλούνται να εμπλουτίσουν τις ψηφιακές συλλογές, είτε με την παραγωγή νέων πληροφοριών (π.χ. με την προσθήκη γεωγραφικών τοποθεσιών) είτε με την αξιολόγηση και την επικύρωση των αυτόματων αποτελεσμάτων που παράγονται από ψηφιακά εργαλεία (π.χ. αυτόματες μεταφράσεις ή εντοπισμός μεροληπτικής γλώσσας).
Το CrowdHeritage έχει χρησιμοποιηθεί εκτενώς για την τόνωση της συμμετοχής σε εκπαιδευτικά περιβάλλοντα και περιβάλλοντα επιστήμης των πολιτών με τη συμμετοχή κοινοτήτων, συμπεριλαμβανομένων φοιτητών και μαθητών, εραστών του πολιτισμού, επαγγελματιών πολιτιστικής κληρονομιάς και του ευρέος κοινού. Η πλατφόρμα έχει μέχρι στιγμής χρησιμοποιηθεί για τη διοργάνωση 40 εκστρατειών πληθοπορισμού με περισσότερους από 970 μοναδικούς συνεισφέροντες, δημιουργώντας περίπου 112.000 σχολιασμούς και αξιολογώντας περισσότερους από 16.000.
MR: Ο πληθοπορισμός βασίζεται στην κατανεμημένη χειρωνακτική προσπάθεια, ενώ το AI4Culture αφορά τις τεχνολογίες τεχνητής νοημοσύνης. Μπορείτε να εξηγήσετε τη σχέση μεταξύ της πλατφόρμας CrowdHeritage και των εργαλείων ΤΝ;
ΣΔ: Το CrowdHeritage σχεδιάστηκε αρχικά για να υποστηρίξει καμπάνιες που προσκαλούν τους χρήστες να προσθέσουν νέα σχόλια από το μηδέν. Μέσα στα τελευταία χρόνια, βλέπουμε ένα αυξανόμενο ενδιαφέρον για τη σύζευξη του CrowdHeritage με εργαλεία τεχνητής νοημοσύνης. Τα εργαλεία αυτά προσφέρουν αξιοσημείωτες ευκαιρίες για την αυτόματη βελτίωση της ποιότητας των συλλογών ψηφιακής πολιτιστικής κληρονομιάς σε κλίμακα και με ελάχιστη χειρωνακτική προσπάθεια, από την οπτική αναγνώριση χαρακτήρων και τη μηχανική μετάφραση έως τον αυτόματο υποτιτλισμό και την ταξινόμηση εικόνων.
Ωστόσο, η προσφυγή σε καθαρά αυτόματες μεθόδους αποκάλυψε επίσης διάφορα ζητήματα που πρέπει να αντιμετωπιστούν. Χρειαζόμαστε τρόπους για να αξιολογήσουμε κατά πόσον τα αποτελέσματα των αλγορίθμων ΤΝ είναι αρκετά ακριβή για τα πρότυπά μας και να συγκρίνουμε τον τρόπο με τον οποίο συμπεριφέρονται οι διαφορετικοί αλγόριθμοι σε συγκεκριμένα δεδομένα και με βάση ορισμένα κριτήρια. Σε αυτό το πλαίσιο, ο πληθοπορισμός είναι ένα εξαιρετικό μέσο για την αξιοποίηση της συλλογικής ανθρώπινης νοημοσύνης και τη συλλογή χρήσιμων πληροφοριών. Η συσσωρευμένη ανατροφοδότηση μπορεί να μας βοηθήσει να φιλτράρουμε λανθασμένα αυτόματα αποτελέσματα, να εφαρμόσουμε κατάλληλα φίλτρα για τη διατήρηση των αποτελεσμάτων που θεωρούμε καλής ποιότητας και να εντοπίσουμε ορισμένες ελλείψεις των αλγορίθμων AI. Σε αυτή την αλληλεπίδραση με την ΤΝ, η πλατφόρμα CrowdHeritage είναι επίσης χρήσιμη για την παραγωγή συνόλων δεδομένων επίγειας αλήθειας που μπορούν να αξιοποιηθούν περαιτέρω για την προσαρμογή των εργαλείων ΤΝ σε σχέση με τα δεδομένα πολιτιστικής κληρονομιάς.
MR: Ειρήνη, μπορείτε να δώσετε ορισμένα συγκεκριμένα παραδείγματα του τρόπου με τον οποίο εφαρμόστηκε το CrowdHeritage σε συνδυασμό με εργαλεία ΤΝ;
ΕΚ : Μπορώ να προσφέρω πολλά! Στο πλαίσιο του έργου Europeana Translate, πραγματοποιήσαμε μια σειρά εκστρατειών όπου οι συμμετέχοντες αξιολόγησαν τα αποτελέσματα ενός αλγορίθμου αυτόματης μετάφρασης που εκπαιδεύτηκε στα μεταδεδομένα Europeana (που αναπτύχθηκε από τον συνεργάτη μας AI4Culture Pangeanic). Αυτή η ανατροφοδότηση μας επέτρεψε να βελτιώσουμε την ποιότητα των αποτελεσμάτων και οδήγησε επίσης στη δημιουργία ανοικτών συνόλων δεδομένων που δημοσιεύθηκαν στο αποθετήριο ELRC-SHARE, το οποίο συγκεντρώνει γλωσσικούς πόρους σε ολόκληρη την ΕΕ.
Σε μια άλλη περιπτωσιολογική μελέτη σχετικά με την επιλογή βέλτιστων μοντέλων Super Resolution (SR) για διαφορετικούς τύπους εικόνων (που γνωρίζετε πολύ καλά, Marco!), διοργανώσαμε μια εκστρατεία σε συνεργασία με την European Fashion Heritage Association (EFHA), όπου ζητήθηκε από τους συμμετέχοντες να συγκρίνουν και να ταξινομήσουν ένα δείγμα εικόνων αναβαθμισμένων από διαφορετικά μοντέλα SR. Τα αποτελέσματα αυτής της καμπάνιας επέτρεψαν στην EFHA να επιλέξει και να εφαρμόσει τον καλύτερο αλγόριθμο SR ανάλογα με τα χαρακτηριστικά της εικόνας.
Στο πλαίσιο του έργου CRAFTED, διοργανώθηκε μια σειρά εκστρατειών για την αξιολόγηση χρωμάτων που αναγνωρίζονται αυτόματα από αλγορίθμους ανίχνευσης χρωμάτων τεχνητής νοημοσύνης. Η ανάλυση της ανατροφοδότησης που συλλέχθηκε μας οδήγησε στο συμπέρασμα ότι οι αυτόματοι αλγόριθμοι προσδιόρισαν επανειλημμένα κάποια συγκεκριμένα απουσιάζοντα χρώματα και έχασαν κάποια υπάρχοντα, κάτι που μας βοήθησε να βελτιώσουμε την προσέγγιση φιλτραρίσματος και να επιλέξουμε την καλύτερη ρύθμιση αλγορίθμου.
Στο έργο DE-BIAS, βρισκόμαστε στη διαδικασία δημιουργίας μιας σειράς εκστρατειών όπου οι κοινότητες θα επιθεωρούν και θα αξιολογούν όρους που επισημαίνονται από ένα αυτόματο εργαλείο ανίχνευσης προκατάληψης ως περιέχοντες υποτιμητική γλώσσα.
MR: Αυτό είναι πραγματικά ενδιαφέρον, Ειρήνη, αλλά θα μπορέσουν τα ιδρύματα πολιτιστικής κληρονομιάς να χρησιμοποιήσουν την πλατφόρμα CrowdHeritage για να δημιουργήσουν τις δικές τους εκστρατείες πληθοπορισμού;
ΕΚ: Και βέβαια! Μέσω του έργου AI4Culture, ένα νέο χαρακτηριστικό «εκδότης εκστρατείας» είναι διαθέσιμο στο CrowdHeritage, το οποίο επιτρέπει σε οποιονδήποτε να δημιουργήσει και να τρέξει μια εκστρατεία πληθοπορισμού στην πλατφόρμα. Οποιοσδήποτε ενδιαφέρεται μπορεί να δει αυτό το εκπαιδευτικό βίντεο ή να δει την τεκμηρίωση του CrowdHeritage για να μάθει περισσότερα!
Μάθετε περισσότερα
Τον Σεπτέμβριο του 2024, το έργο θα εγκαινιάσει μια πλατφόρμα όπου ένα σύνολο ανοικτών εργαλείων θα είναι διαθέσιμο στο διαδίκτυο, μαζί με σχετική τεκμηρίωση και εκπαιδευτικό υλικό. Παρακολουθήστε τη σελίδα του έργου στην Europeana Pro για περισσότερες λεπτομέρειες και μείνετε συντονισμένοι στον λογαριασμό LinkedIn και X του έργου!
