Ο EU Datathon είναι ένας ετήσιος διαγωνισμός που παρέχει «μια ευκαιρία στους λάτρεις των ανοικτών δεδομένων και στους προγραμματιστές εφαρμογών από όλο τον κόσμο να αποδείξουν τις δυνατότητες των ανοικτών δεδομένων, να αποκτήσουν διεθνή προβολή για τις καινοτόμες ιδέες τους και να διαγωνιστούν για το μερίδιό τους στο συνολικό χρηματικό έπαθλο των 200 000 ευρώ και στο Βραβείο Δημόσιας Επιλογής». Καλούνται να κάνουν χρήση της data.europa.eu, της επίσημης πύλης για τα ευρωπαϊκά δεδομένα, την οποία διαχειρίζεται η Υπηρεσία Εκδόσεων της Ευρωπαϊκής Ένωσης.
Με το σύνολο δεδομένων Europeana.eu που δημοσιεύθηκε στη διεύθυνση data.europa.eu νωρίτερα φέτος, η συγκέντρωση μεταδεδομένων από τα περίπου 4 000 ιδρύματα πολιτιστικής κληρονομιάς που παρέχουν περιεχόμενο στην Europeana, προτάσεις και εφαρμογές που έχουν σχεδιαστεί για τον διαγωνισμό θα μπορούσαν επίσης να επωφεληθούν από αυτό για τις συμμετοχές τους. Ως επίσημος εταίρος του διαγωνισμού, η Europeana προσκάλεσε ερευνητές, πανεπιστημιακούς καθηγητές και φοιτητές από τις Κοινωνικές και Ανθρωπιστικές Επιστήμες και την Επιστήμη των Υπολογιστών και της Πληροφορίας να συμμετάσχουν στο EU Datathon.
Μετά από δύο γύρους προεπιλογής 156 συμμετοχών από 38 χώρες, μια ομάδα που αναπτύσσει μια εφαρμογή με βάση το σύνολο δεδομένων Europeana.eu ήταν μία από τις 12 φιναλίστ και έλαβε βραβείο 7.000 ευρώ στο πλαίσιο της πρόκλησης αριθ. 4: «Μια Ευρώπη έτοιμη για την ψηφιακή εποχή» κατά την τελετή απονομής των βραβείων που πραγματοποιήθηκε στις Βρυξέλλες στις 20 Οκτωβρίου 2022. Η ομάδα αποτελείται από την καθηγήτρια Johanna Monti· ερευνήτρια, Maria Pia di Buono· και δύο διδακτορικοί φοιτητές, Gennaro Nolano και Giulia Speranza. Η Johanna Monti μας μιλάει για την εμπειρία.
Μπορείτε να μας πείτε για την εφαρμογή που αναπτύξατε και τη διαδικασία δημιουργίας της;
Αναπτύξαμε το Maggie, ένα chatbot σε πραγματικό χρόνο που λειτουργεί ως εικονικός βοηθός για να βοηθήσει τους ανθρώπους να έχουν πρόσβαση και να ανακαλύψουν ευρωπαϊκό πολιτιστικό περιεχόμενο. Οι άνθρωποι μπορούν να αλληλεπιδρούν με τη Maggie μέσω ερωτήσεων φυσικής γλώσσας και να ρωτούν σχετικά με την ευρωπαϊκή πολιτιστική κληρονομιά.
Η κύρια ιδέα πίσω από τη Maggie είναι η αξιοποίηση των μεθοδολογιών Τεχνητής Νοημοσύνης (AI) και Επεξεργασίας Φυσικής Γλώσσας (NLP) για την ανάπτυξη μιας εφαρμογής με επίκεντρο τον χρήστη που διευκολύνει την πρόσβαση και την ανακάλυψη πολυγλωσσικού πολιτιστικού περιεχομένου. Το κοινό στο οποίο απευθύνεται η Maggie είναι πολύ διαφορετικό· η εφαρμογή προσαρμόζει το περιεχόμενο στις γνώσεις και τα ενδιαφέροντα των χρηστών για να ικανοποιήσει διαφορετικές ανάγκες πληροφόρησης, από σπουδαστές έως εμπειρογνώμονες.
Η Maggie είναι το αποτέλεσμα περισσότερων από μια δεκαετία ερευνητικών δραστηριοτήτων που ξεκίνησαν το 2012 με τα πρώτα μας πειράματα στην ανάκτηση διαγλωσσικών πληροφοριών σχετικά με την πολιτιστική κληρονομιά. Μετά από αυτό, πολλά ορόσημα σηματοδότησαν το δρόμο μας προς τη Maggie, συμπεριλαμβανομένης της ίδρυσης της ερευνητικής ομάδας UNIOR NLP του Πανεπιστημίου της Νάπολης L'Orientale το 2016, και αρκετών έργων από το 2019 έως το 2021, συμπεριλαμβανομένου του έργου SMACH (Semantic Multilingual Access to Cultural Heritage), του έργου ArchaeoTerm που προσφέρει μια πηγή αρχαιολογικών όρων που διατίθενται στο πλαίσιο του έργου YourTerm CULT, και του έργου NEAT (Named Entities in Archaeological Texts).
Γιατί αποφασίσατε να χρησιμοποιήσετε το σύνολο δεδομένων Europeana.eu;
Η ερευνητική μας ομάδα έχει δεσμευτεί να κάνει το πολιτιστικό περιεχόμενο εύκολα προσβάσιμο για όλους, αναπτύσσοντας συστήματα και εφαρμογές για την πολιτιστική κληρονομιά. Υπό την έννοια αυτή, έχουμε ήδη αξιοποιήσει τα ευρωπαϊκά ανοικτά δεδομένα (με τη μορφή δεδομένων από τον ιστότοπο της Europeana) σε διάφορα έργα, όλα με στόχο τη βελτίωση των σημερινών υπερσύγχρονων εργασιών επεξεργασίας φυσικής γλώσσας για καλύτερη πρόσβαση σε περιεχόμενο πολιτιστικής κληρονομιάς.
Σε όλες αυτές τις περιπτώσεις, ο πυρήνας των δεδομένων που χρησιμοποιήσαμε αντιπροσωπεύεται από ανοικτά δεδομένα που προέρχονται από το API αναζήτησης της Europeana, γεγονός που διευκολύνει την πρόσβαση και την επαναχρησιμοποίηση των συγκεντρωτικών δεδομένων, διασφαλίζοντας παράλληλα την υψηλή ποιότητα των δεδομένων και την πολυγλωσσία τους. Ενώ σε προηγούμενα πειράματα πολλές από τις πληροφορίες που περιγράφονται από το μοντέλο δεδομένων της Europeana (όπως δεδομένα σχετικά με τον εντοπισμό, τους συγγραφείς και τα θέματα) δεν χρησιμοποιήθηκαν για την ανάπτυξη της Maggie, αξιοποιούμε πλήρως την πλούσια πηγή πληροφοριών που προσφέρει η Europeana, καθώς στοχεύσαμε στην ανάπτυξη μιας πιο συγκεκριμένης εργασίας επεξεργασίας φυσικής γλώσσας.

Το EU Datathon ενθαρρύνει τη χρήση συνόλων ανοικτών δεδομένων. Γιατί το άνοιγμα των δεδομένων είναι σημαντικό για την έρευνα και την εφαρμογή σας;
Τα ανοικτά δεδομένα διασφαλίζουν την αναπαραγωγιμότητα και τη διαφάνεια στην έρευνα. Η διαθεσιμότητα των δεδομένων αυτών αποτελεί τρόπο ενθάρρυνσης της ανταλλαγής γνώσεων και της συνεργασίας στις επιστημονικές κοινότητες. Οι περισσότερες από τις ερευνητικές μας προσπάθειες αξιοποιούν ανοικτά δεδομένα από διάφορες πηγές. Αυτή είναι η περίπτωση της εφαρμογής μας Maggie. Χωρίς ανοικτά δεδομένα από την Europeana και τη data.europa.eu, δεν θα μπορούσαμε να αναπτύξουμε τη Maggie. Εξάγουμε πληροφορίες σχετικά με κάθε έργο τέχνης που διατίθεται μέσω της Europeana, όπως ο συντάκτης του, η ημερομηνία δημιουργίας κ.ο.κ., και συγκεντρώνουμε τις πληροφορίες σχετικά με τη γεωγραφική του θέση από το GeoDataset of data.europa.eu.
Γιατί αποφασίσατε να συμμετάσχετε στον διαγωνισμό EU Datathon;
Ήταν μια μεγάλη πρόκληση για εμάς, καθώς προσπαθήσαμε να συγκεντρώσουμε όλες τις προηγούμενες προσπάθειές μας σε μία ενιαία εφαρμογή, η οποία θα μπορούσε να βοηθήσει τους ανθρώπους να έχουν εύκολη πρόσβαση σε ευρωπαϊκό πολιτιστικό περιεχόμενο στη σημερινή ψηφιακή εποχή. Ωστόσο, αντιπροσώπευε επίσης μια ευκαιρία να βγούμε από την καθαρή ακαδημαϊκή έρευνα και να δεσμευτούμε σε μια απόδειξη της ιδέας που υπερβαίνει το στάδιο του πρωτοτύπου, προς κάτι που θα μπορούσε πραγματικά να χρησιμοποιηθεί σε μια πραγματική κατάσταση. παράλληλα με τη χρήση μεθοδολογιών, πόρων και εργαλείων αιχμής στον τομέα της επεξεργασίας φυσικής γλώσσας και της τεχνητής νοημοσύνης.
Τι συμβουλές θα δίνατε σε άλλους που συμμετέχουν σε έναν τέτοιο διαγωνισμό;
Η συμμετοχή σε διαγωνισμούς που προωθούν τη χρήση ανοικτών δεδομένων είναι ένας τρόπος υποστήριξης της εφαρμογής, της διάδοσης και της υιοθέτησης των εν λόγω δεδομένων. Συμβάλλει επίσης στη βελτίωση και τη συντήρηση συνόλων δεδομένων τα οποία, λόγω του όγκου των δεδομένων και των πηγών, είναι δύσκολο να διαχειριστούν, να καθαριστούν και να δοκιμαστούν. Τα αποτελέσματα αυτών των διαγωνισμών έχουν πραγματικό αντίκτυπο στην κοινωνία, που συνδέεται άμεσα με τη δυνατότητα βελτίωσης της ποιότητας ζωής των πολιτών, καθιστώντας τις πληροφορίες και τις γνώσεις σχετικά με την κοινωνία στην οποία ζουν προσβάσιμες και άμεσα διαθέσιμες. Η συμβουλή μας προς τους ερευνητές είναι να βγουν από τη ζώνη άνεσής τους και να συνδυάσουν την αυστηρότητα της έρευνας με τη δημιουργικότητα της διαδικασίας σχεδιασμού, σκεπτόμενοι τον ευεργετικό αντίκτυπο στην κοινωνία ως τελικό στόχο.
