Il Datathon dell'UE è un concorso annuale che offre agli appassionati di dati aperti e agli sviluppatori di applicazioni di tutto il mondo la possibilità di dimostrare il potenziale dei dati aperti, ottenere visibilità internazionale per le loro idee innovative e competere per la loro quota del fondo premi totale di 200 000 EUR e del premio "Public Choice Award". Sono invitati a utilizzare data.europa.eu, il portale ufficiale per i dati europei, gestito dall'Ufficio delle pubblicazioni dell'Unione europea.
Con il set di dati Europeana.eu pubblicato su data.europa.eu all'inizio di quest'anno, l'aggregazione dei metadati dei circa 4 000 istituti di tutela del patrimonio culturale che forniscono contenuti a Europeana, le proposte e le app progettate per il concorso potrebbero beneficiarne anche per le loro voci. In qualità di partner ufficiale del concorso, Europeana ha invitato ricercatori, professori universitari e studenti di scienze sociali e umanistiche e informatica e informatica a partecipare al Datathon dell'UE.
Dopo due turni di preselezioni di 156 partecipanti provenienti da 38 paesi, un team che sta sviluppando un'app basata sul set di dati Europeana.eu è stato uno dei 12 finalisti e ha ricevuto un premio di 7.000 euro nell'ambito della sfida numero 4: "Un'Europa pronta per l'era digitale" alla cerimonia di premiazione tenutasi a Bruxelles il 20 ottobre 2022. Il gruppo è composto dalla professoressa Johanna Monti; ricercatrice, Maria Pia di Buono; e due dottorandi, Gennaro Nolano e Giulia Speranza. Johanna Monti ci racconta l'esperienza.
Puoi parlarci dell'app che hai sviluppato e del processo di creazione?
Abbiamo sviluppato Maggie, un chatbot in tempo reale che funge da assistente virtuale per aiutare le persone ad accedere e scoprire i contenuti culturali europei. Le persone possono interagire con Maggie attraverso domande sul linguaggio naturale e chiedere informazioni sul patrimonio culturale europeo.
L'idea principale alla base di Maggie è sfruttare le metodologie di Intelligenza Artificiale (AI) e Natural Language Processing (NLP) per sviluppare un'app incentrata sull'utente che faciliti l'accesso e la scoperta di contenuti culturali multilingue. Il pubblico previsto di Maggie è molto vario; l'app adatta i contenuti alle conoscenze e agli interessi degli utenti per soddisfare le diverse esigenze di informazione, dagli studenti agli esperti.
Maggie è il risultato di oltre un decennio di attività di ricerca iniziate nel 2012 con i nostri primissimi esperimenti di recupero di informazioni trasversali sul patrimonio culturale. Successivamente, diverse pietre miliari hanno segnato il nostro cammino verso Maggie, tra cui l'istituzione del gruppo di ricerca UNIOR NLP dell'Università degli Studi di Napoli L'Orientale nel 2016, e diversi progetti dal 2019 al 2021, tra cui il progetto SMACH (Semantic Multilingual Access to Cultural Heritage), il progetto ArchaeoTerm che offre una risorsa di termini archeologici disponibili nell'ambito del progetto YourTerm CULT e il progetto NEAT (Named Entities in Archaeological Texts).
Perché ha deciso di utilizzare il set di dati Europeana.eu?
Il nostro gruppo di ricerca si è sempre impegnato a rendere i contenuti culturali facilmente accessibili a tutti, sviluppando sistemi e applicazioni per il patrimonio culturale. In questo senso, abbiamo già sfruttato i dati aperti europei (sotto forma di dati del sito web Europeana) in diverse opere, tutte volte a migliorare l'attuale stato dell'arte nei compiti di elaborazione del linguaggio naturale per un migliore accesso ai contenuti del patrimonio culturale.
In tutti questi casi, il nucleo dei dati che abbiamo utilizzato era rappresentato dai dati aperti raschiati dall'API Europeana Search, che facilita l'accesso ai dati aggregati e il loro riutilizzo, garantendo nel contempo l'elevata qualità dei dati e la loro multilinguità. Mentre negli esperimenti precedenti gran parte delle informazioni descritte dal modello di dati Europeana (come i dati sulla localizzazione, gli autori e i temi) non sono stati utilizzati, per sviluppare Maggie, sfruttiamo appieno la ricca fonte di informazioni offerta da Europeana, poiché miravamo a sviluppare un compito più specifico di elaborazione del linguaggio naturale.

Il Datathon dell'UE incoraggia l'uso di insiemi di dati aperti. Perché l'apertura dei dati è importante per la tua ricerca e app?
L'open data garantisce riproducibilità e trasparenza nella ricerca. La disponibilità di tali dati rappresenta un modo per incoraggiare la condivisione delle conoscenze e la cooperazione nelle comunità scientifiche. La maggior parte dei nostri sforzi di ricerca sfruttano i dati aperti provenienti da diverse fonti. Questo è il caso della nostra app Maggie. Senza i dati aperti di Europeana e data.europa.eu, non avremmo potuto sviluppare Maggie. Estraiamo informazioni su ogni opera resa disponibile attraverso Europeana, come il suo autore, la data di creazione e così via, e aggreghiamo le informazioni sulla sua geolocalizzazione dal GeoDataset di data.europa.eu.
Perché hai deciso di partecipare al concorso Datathon dell'UE?
È stata una grande sfida per noi, poiché abbiamo cercato di riunire tutti i nostri sforzi precedenti in un'unica applicazione che potesse aiutare le persone ad accedere facilmente ai contenuti culturali europei nell'era digitale di oggi. Tuttavia, ha rappresentato anche un'opportunità per uscire dalla pura ricerca accademica e impegnarsi in una dimostrazione di concetto che va oltre la fase del prototipo, verso qualcosa che potrebbe effettivamente essere utilizzato in una situazione reale; il tutto utilizzando metodologie, risorse e strumenti all'avanguardia nell'elaborazione del linguaggio naturale e nell'intelligenza artificiale.
Che consiglio daresti agli altri che partecipano a una competizione come questa?
Partecipare a concorsi che promuovono l'uso di dati aperti è un modo per sostenere l'implementazione, la diffusione e l'adozione di tali dati. Contribuisce inoltre al miglioramento e alla manutenzione di set di dati che, a causa della quantità di dati e fonti, sono difficili da gestire, pulire e testare. I risultati di questi tipi di concorsi hanno un impatto reale sulla società, direttamente correlato alla possibilità di migliorare la qualità della vita dei cittadini, rendendo accessibili e prontamente disponibili le informazioni e le conoscenze sulla società in cui vivono. Il nostro consiglio ai ricercatori è quello di uscire dalla loro zona di comfort e di combinare il rigore della ricerca con la creatività del processo di progettazione, pensando all'impatto benefico sulla società come obiettivo finale.
