EU Datathon er en årlig konkurrence, der giver åbne dataentusiaster og applikationsudviklere fra hele verden mulighed for at demonstrere potentialet i åbne data, få international synlighed for deres innovative idéer og konkurrere om deres andel af den samlede prisfond på 200 000 EUR og Public Choice Award. De opfordres til at gøre brug af data.europa.eu, den officielle portal for europæiske data, der forvaltes af Den Europæiske Unions Publikationskontor.
Da Europeana.eu-datasættet blev offentliggjort på data.europa.eu tidligere på året, kunne man ved at aggregere metadata fra de ca. 4 000 kulturarvsinstitutioner, der leverer indhold til Europeana, også drage fordel af forslag og apps, der er udformet til konkurrencen, i forbindelse med deres bidrag. Som officiel partner i konkurrencen inviterede Europeana forskere, universitetsprofessorer og studerende fra samfundsvidenskab og humaniora samt computer- og informationsvidenskab til at deltage i EU Datathon.
Efter to runder med forhåndsudvælgelser af 156 bidrag fra 38 lande var et team, der er i færd med at udvikle en app baseret på Europeana.eu-datasættet, en af de 12 finalister og fik tildelt en pris på 7 000 EUR under udfordring nr. 4: "Et Europa klar til den digitale tidsalder" ved prisoverrækkelsen, der fandt sted i Bruxelles den 20. oktober 2022. Holdet består af professor Johanna Monti. forsker ved Maria Pia di Buono og to ph.d.-studerende, Gennaro Nolano og Giulia Speranza. Johanna Monti fortæller om oplevelsen.
Kan du fortælle os om den app, du har udviklet, og processen med at oprette den?
Vi udviklede Maggie, en chatbot i realtid, der fungerer som en virtuel assistent, der hjælper folk med at få adgang til og opdage europæisk kulturelt indhold. Folk kan interagere med Maggie gennem naturlige sprogspørgsmål og spørge om europæisk kulturarv.
Hovedidéen bag Maggie er at udnytte metoder inden for kunstig intelligens (AI) og natursprogsbehandling (NLP) til at udvikle en brugercentreret app, der letter adgangen til og opdagelsen af flersproget kulturelt indhold. Det tilsigtede publikum af Maggie er meget forskelligartet; Appen skræddersyr indhold til brugernes viden og interesser for at opfylde forskellige informationsbehov, fra studerende til eksperter.
Maggie er resultatet af mere end et årti med forskningsaktiviteter, der begyndte i 2012 med vores allerførste eksperimenter med hentning af tværsproglig information om kulturarv. Derefter markerede flere milepæle vores vej til Maggie, herunder oprettelsen af UNIOR NLP-forskningsgruppen ved universitetet i Napoli L'Orientale i 2016 og flere projekter fra 2019 til 2021, herunder SMACH-projektet (semantisk flersproget adgang til kulturarv), ArchaeoTerm-projektet, som tilbyder en ressource af arkæologiske termer, der er tilgængelige inden for rammerne af YourTerm CULT-projektet, og NEAT-projektet (Named Entities in Archaeological Texts).
Hvorfor besluttede du at anvende Europeana.eu-datasættet?
Vores forskningsgruppe har altid været engageret i at gøre kulturelt indhold let tilgængeligt for alle ved at udvikle systemer og applikationer til kulturarv. I den henseende har vi allerede udnyttet europæiske åbne data (i form af data fra Europeana-webstedet) i flere værker, der alle har til formål at forbedre den nuværende state-of-the-art i Natural Language Processing-opgaver for bedre adgang til kulturarvsindhold.
I alle disse tilfælde var kernen i de data, vi anvendte, repræsenteret ved åbne data skrabet fra Europeana Search API, hvilket gør det nemt at få adgang til aggregerede data og genanvende dem, samtidig med at dataenes høje kvalitet og deres flersprogethed sikres. Mens mange af de oplysninger, der er beskrevet af Europeana Data Model (såsom data om lokalisering, forfattere og temaer) i tidligere eksperimenter ikke blev brugt til at udvikle Maggie, udnytter vi fuldt ud den rige informationskilde, der tilbydes af Europeana, da vi havde til formål at udvikle en mere specifik Natural Language Processing-opgave.

EU Datathon opfordrer til brug af åbne datasæt. Hvorfor er åbenhed af data vigtigt for din forskning og app?
Åbne data sikrer reproducerbarhed og gennemsigtighed i forskningen. Tilgængeligheden af sådanne data er en måde at tilskynde til videndeling og samarbejde i videnskabelige samfund på. De fleste af vores forskningsindsatser udnytter åbne data fra flere kilder. Dette er tilfældet med vores app Maggie. Uden åbne data fra Europeana og data.europa.eu kunne vi ikke have udviklet Maggie. Vi udtrækker oplysninger om hvert kunstværk, der stilles til rådighed via Europeana, f.eks. ophavsmand, oprettelsesdato osv., og vi samler oplysningerne om dets geolokalisering fra geodatasættet på data.europa.eu.
Hvorfor besluttede du dig for at deltage i EU Datathon-konkurrencen?
Det var en stor udfordring for os, da vi forsøgte at samle alle vores tidligere bestræbelser i én enkelt ansøgning, som kunne hjælpe folk med let at få adgang til europæisk kulturelt indhold i dagens digitale tidsalder. Det udgjorde imidlertid også en mulighed for at komme ud af ren akademisk forskning og forpligte sig i et proof of concept, der går ud over prototypefasen, i retning af noget, der faktisk kan bruges i en situation i den virkelige verden; samtidig med at der gøres brug af de nyeste metoder, ressourcer og værktøjer inden for natursprogsbehandling og kunstig intelligens.
Hvilket råd vil du give andre, der deltager i en konkurrence som denne?
Deltagelse i konkurrencer, der fremmer brugen af åbne data, er en måde at støtte gennemførelsen, udbredelsen og vedtagelsen af sådanne data på. Det bidrager også til forbedring og vedligeholdelse af datasæt, som på grund af mængden af data og kilder er vanskelige at håndtere, rengøre og teste. Resultaterne af disse typer udvælgelsesprøver har en reel indvirkning på samfundet, der er direkte forbundet med muligheden for at forbedre borgernes livskvalitet ved at gøre oplysninger og viden om det samfund, de lever i, tilgængelige og lettilgængelige. Vores råd til forskere er at komme ud af deres komfortzone og kombinere forskningens stringens med designprocessens kreativitet og tænke på den gavnlige indvirkning på samfundet som det endelige mål.
