Marco Rendina: Eirini, partiamo dalle basi. Cos'è il crowdsourcing?
Eirini Kaldeli: Il crowdsourcing è il processo di distribuzione di un compito a un gruppo di persone, che di solito contribuiscono attraverso il loro lavoro online. In alcuni casi, i contributori ricevono un compenso materiale; in altri, la loro partecipazione è volontaria, con ricompense irrilevanti, come la soddisfazione personale, il contributo culturale o l'acquisizione di conoscenze. All'interno del settore del patrimonio culturale, il crowdsourcing è stato a lungo utilizzato per affrontare varie sfide, dalla raccolta e trascrizione dei contenuti alla marcatura delle collezioni e all'individuazione di termini distorti nella descrizione dei beni del patrimonio culturale. A seconda della natura del compito, i partecipanti potrebbero aver bisogno di competenze o conoscenze specialistiche.
MR: Quali sono i vantaggi del crowdsourcing per il settore del patrimonio culturale?
EK: Un progetto di crowdsourcing responsabile e significativo può portare benefici reciproci alle istituzioni del patrimonio culturale e ai partecipanti. In primo luogo, il crowdsourcing dovrebbe essere considerato un mezzo per coinvolgere i cittadini nelle collezioni del patrimonio. Da un lato, i partecipanti hanno l'opportunità di interagire con il patrimonio culturale e connettersi con esso; apprendere informazioni utili su oggetti e argomenti in modo giocoso; condividere le loro prospettive e conoscenze; co-modellare le modalità di presentazione delle collezioni; e collaborare con i concittadini in un'esperienza partecipativa. D'altro canto, gli istituti di tutela del patrimonio culturale possono migliorare la qualità delle loro collezioni e renderle più reperibili e accessibili; sensibilizzare in merito ai loro beni del patrimonio culturale; raggiungere un nuovo pubblico; e ottenere approfondimenti più approfonditi su come le loro collezioni sono percepite dalle comunità.
MR: Spyros, potresti dirci qualche parola sulla piattaforma CrowdHeritage a cui stai lavorando nel contesto del progetto AI4Culture?
Spyros Bekiaris: CrowdHeritage è una piattaforma aperta per l'organizzazione di campagne di crowdsourcing online che mobilitano le persone per migliorare la qualità delle collezioni del patrimonio culturale. Ciò potrebbe riguardare diversi aspetti, dalla copertura multilingue alla marcatura semantica. I partecipanti sono invitati ad arricchire le collezioni digitali, producendo nuove informazioni (ad esempio aggiungendo geolocalizzazioni) o valutando e convalidando i risultati automatici prodotti da strumenti digitali (ad esempio traduzioni automatiche o rilevamento di un linguaggio distorto).
CrowdHeritage è stato ampiamente utilizzato per stimolare la partecipazione in ambienti educativi e contesti di scienza dei cittadini coinvolgendo comunità tra cui studenti e alunni, amanti della cultura, professionisti del patrimonio culturale e il pubblico in generale. La piattaforma è stata finora utilizzata per organizzare 40 campagne di crowdsourcing con oltre 970 contributori unici, generando circa 112.000 annotazioni e valutando più di 16.000.
MR: Il crowdsourcing è radicato nello sforzo manuale distribuito, mentre AI4Culture riguarda le tecnologie AI. Puoi spiegare la relazione tra la piattaforma CrowdHeritage e gli strumenti di IA?
SB: CrowdHeritage è stato originariamente progettato per supportare campagne che invitano gli utenti ad aggiungere nuove annotazioni da zero. Negli ultimi anni, stiamo assistendo a un crescente interesse nell'accoppiare CrowdHeritage con gli strumenti di IA. Tali strumenti offrono notevoli opportunità per migliorare automaticamente la qualità delle collezioni digitali di beni culturali su larga scala e con il minimo sforzo manuale, dal riconoscimento ottico dei caratteri e dalla traduzione automatica, alla sottotitolazione automatica e alla classificazione delle immagini.
Tuttavia, il ricorso a metodi puramente automatici ha anche rivelato diversi problemi che devono essere affrontati. Abbiamo bisogno di modi per valutare se i risultati degli algoritmi di IA sono sufficientemente accurati per i nostri standard e per confrontare il modo in cui i diversi algoritmi si comportano su dati specifici e sulla base di determinati criteri. In questo contesto, il crowdsourcing è un ottimo mezzo per sfruttare l'intelligenza umana collettiva e raccogliere informazioni utili. Il feedback accumulato può aiutarci a filtrare i risultati automatici errati, applicare filtri appropriati per mantenere quelli che consideriamo risultati di buona qualità e individuare alcune carenze degli algoritmi di IA. In questa interazione con l'IA, la piattaforma CrowdHeritage è utile anche per produrre set di dati sulla verità di base che possono essere ulteriormente sfruttati per adattare gli strumenti di IA in relazione ai dati sul patrimonio culturale.
MR: Eirini, puoi fornire alcuni esempi concreti di come CrowdHeritage è stato applicato in combinazione con strumenti di IA?
EK: Sono in grado di fornire molti! Nell'ambito del progetto Europeana Translate, abbiamo condotto una serie di campagne in cui i partecipanti hanno valutato i risultati di un algoritmo di traduzione automatica addestrato sui metadati di Europeana (sviluppato dal nostro partner AI4Culture Pangeanic). Questo feedback ci ha permesso di migliorare la qualità dei risultati e ha anche portato alla creazione di set di dati aperti pubblicati sull'archivio ELRC-SHARE, che raccoglie risorse linguistiche in tutta l'UE.
In un altro caso di studio sulla selezione di modelli ottimali Super Resolution (SR) per diversi tipi di immagine (che conosci molto bene, Marco!), abbiamo istituito una campagna in collaborazione con l'European Fashion Heritage Association (EFHA), in cui ai partecipanti è stato chiesto di confrontare e classificare un campione di immagini ridimensionate da diversi modelli SR. I risultati di questa campagna hanno permesso a EFHA di selezionare e applicare il miglior algoritmo SR a seconda delle caratteristiche dell'immagine.
Nell'ambito del progetto CRAFTED, sono state organizzate una serie di campagne per valutare i colori identificati automaticamente dagli algoritmi di rilevamento dei colori dell'IA. L'analisi dei feedback raccolti ci ha portato alla conclusione che gli algoritmi automatici hanno ripetutamente identificato alcuni specifici colori assenti e ne hanno persi alcuni esistenti, cosa che ci ha aiutato a migliorare il nostro approccio di filtraggio e a selezionare la migliore configurazione dell'algoritmo.
Nel progetto DE-BIAS, stiamo creando una serie di campagne in cui le comunità esamineranno e valuteranno i termini contrassegnati da uno strumento di rilevamento automatico dei pregiudizi come contenenti un linguaggio dispregiativo.
MR: Questo è davvero interessante, Eirini, ma le istituzioni del patrimonio culturale saranno in grado di utilizzare la piattaforma CrowdHeritage per creare le proprie campagne di crowdsourcing?
EK: Certo che sì! Attraverso il progetto AI4Culture è stata resa disponibile su CrowdHeritage una nuova funzione di "editor di campagne", che consente a chiunque di creare e gestire una campagna di crowdsourcing sulla piattaforma. Chiunque sia interessato può guardare questo video tutorial o controllare la documentazione di CrowdHeritage per saperne di più!
Scopri di più
Nel settembre 2024 il progetto lancerà una piattaforma in cui sarà resa disponibile online una serie di strumenti aperti, insieme alla relativa documentazione e ai materiali di formazione. Tieni d'occhio la pagina del progetto su Europeana Pro per maggiori dettagli e resta sintonizzato sul progetto LinkedIn e sull'account X!
