Metodi dal campo dell'intelligenza artificiale (IA) e dell'apprendimento automatico (ML) hanno contribuito a spingere i confini tecnologici in vari settori, anche nel settore del patrimonio culturale (la relazione intermedia dell'IA EuropeanaTech in relazione alla task force GLAM e l'iniziativa AI4LAM forniscono alcuni esempi). Per incoraggiare l'innovazione in questo settore, alcune settimane fa EuropeanaTech ha annunciato la sua prima Challenge for Europeana AI/ML Datasets. Con questa nuova attività, abbiamo voluto stimolare la creazione di dataset per il settore GLAM che possano essere utilizzati per AI/ML, attingendo alle ricche risorse del patrimonio culturale disponibili in Europeana. Ci auguriamo che la disponibilità di tali set di dati possa contribuire a promuovere un maggiore coinvolgimento con i dati del patrimonio culturale digitale nell'IA/ML e sostenere il trasferimento dei recenti progressi nell'IA/ML al settore della cura digitale e dell'analisi dei contenuti del patrimonio culturale.
La Corte ha ricevuto un totale di cinque proposte, che sono state attentamente esaminate dai membri del gruppo direttivo EuropeanaTech e dell’IA in relazione alla task force GLAM. Hanno valutato le proposte in base alla loro pertinenza per il settore GLAM (25%), pertinenza per l'IA/ML (25%), relazione con Europeana (30%) e chiarezza della descrizione e del piano di lavoro (20%).
Annunciare i vincitori
Entità nominate nei testi archeologici
Questa proposta di un team con sede presso l'Università degli Studi di Napoli 'L'Orientale' mira a creare un set di dati per Named Entity Recognition (NER) e Term Extraction per termini archeologici in italiano e inglese nella collezione Europeana Archeology. NER è il processo di identificazione di nomi propri come nomi di persone o posizioni in testo non strutturato. Termine Estrazione è simile, ma si concentra sulla ricerca di termini specializzati, in questo caso dal dominio dell'archeologia. Vocabolari come Getty e CIDOC CRM saranno presi in considerazione. L'insieme di dati definitivo potrebbe essere utilizzato per lo sviluppo e la valutazione di tecnologie basate sull'IA/ML per il NER nel settore dell'archeologia.
I revisori hanno particolarmente apprezzato la chiara struttura e maturità della proposta, per la quale è già stato realizzato un set di dati fittizio utilizzando le API di Europeana per testare l'approccio proposto. Anche l'aspetto bilingue e la scarsità di risorse aperte simili per il campo dell'archeologia sono stati considerati particolarmente preziosi.
Zac Grace
Questa proposta di uno studente dell'Ecole Nationale d'Ingénieurs de Tarbes mira a creare maschere pixel per la segmentazione semantica, attraverso l'annotazione manuale dei dati di immagine nella collezione Europeana Fashion. Ciò significa che, ad esempio, quando un'immagine viene analizzata, gli elementi di moda rilevanti (camicia, pantaloni, scarpe) nell'immagine vengono quindi contrassegnati con i loro contorni in pixel. Tali dati possono essere utilizzati per la formazione di un sistema di segmentazione automatizzato.

Ai revisori è piaciuta la chiara portata e comprensione del lavoro necessario per attuare la proposta. Hanno anche pensato che avesse un sacco di potenziale per l'applicazione in diverse collezioni.
I contesti controversi Corpus
Questa proposta congiunta del KNAW Humanities Cluster e del Centrum Wiskunde & Informatica nei Paesi Bassi vuole stabilire un corpus commentato di termini controversi nel contesto (ConConCor) dai giornali olandesi in Europeana. Questi possono quindi essere utilizzati per avviare e valutare metodi (semi)automatici per rilevare tali termini nelle collezioni del patrimonio culturale. Termini controversi qui significano quelle parole o frasi che sono indicative di alcuni pregiudizi (impliciti o espliciti) verso o contro un gruppo, un evento o altro.
I revisori hanno valutato il modo in cui la presente proposta mira ad affrontare un obiettivo chiave nella sfida, l'individuazione di questioni etiche e pregiudizi inerenti alle collezioni digitalizzate del patrimonio culturale.
Tre stipendi di 2.500 euro ciascuno saranno messi a disposizione dei vincitori al fine di attuare le loro proposte e fornire le serie di dati corrispondenti entro la fine di giugno 2021.
Scopri di più
Vorremmo estendere la nostra gratitudine a tutti coloro che hanno presentato una proposta a questa sfida per il loro duro lavoro e le idee eccellenti. Attendiamo con impazienza l'attuazione dei progetti vincitori e speriamo che in futuro si aprirà un altro round per coloro che non hanno avuto successo questa volta!
Se desideri saperne di più su opportunità come questa e fare rete e collaborare con professionisti tecnici multidisciplinari di tutto il mondo, iscriviti a EuropeanaTech attraverso Europeana Network Association e segui la community su Twitter.
Questo post è stato modificato il 16/04/21 per riflettere il termine prorogato per la consegna dei set di dati da parte dei vincitori.
