EU Datathon är en årlig tävling som ger ”en chans för entusiaster av öppna data och applikationsutvecklare från hela världen att visa potentialen hos öppna data, få internationell synlighet för sina innovativa idéer och tävla om sin andel av den totala prisfonden på 200 000 euro och Public Choice Award”. De uppmanas att använda sig av data.europa.eu, den officiella portalen för europeiska data, som förvaltas av Europeiska unionens publikationsbyrå.
I och med att datasetet Europeana.eu publicerades på data.europa.eu tidigare i år skulle man också kunna dra nytta av att samla in metadata från de cirka 4 000 kulturarvsinstitutioner som tillhandahåller innehåll till Europeana, förslag och appar som utformats för tävlingen. Som officiell partner i tävlingen bjöd Europeana in forskare, universitetsprofessorer och studenter från samhällsvetenskap och humaniora samt data- och informationsvetenskap att delta i EU Datathon.
Efter två omgångar med förhandsurval av 156 bidrag från 38 länder var ett team som utvecklar en app baserad på datasetet Europeana.eu en av de 12 finalisterna och tilldelades ett pris på 7 000 euro under utmaning nummer 4: Ett Europa rustat för den digitala tidsåldern vid prisceremonin i Bryssel den 20 oktober 2022. Gruppen består av professor Johanna Monti. forskare, Maria Pia di Buono, och två doktorander, Gennaro Nolano och Giulia Speranza. Johanna Monti berättar om upplevelsen.
Kan du berätta om appen du utvecklade och processen att skapa den?
Vi utvecklade Maggie, en realtidschatbot som fungerar som en virtuell assistent för att hjälpa människor att få tillgång till och upptäcka europeiskt kulturellt innehåll. Människor kan interagera med Maggie genom frågor om naturligt språk och ställa frågor om det europeiska kulturarvet.
Huvudidén bakom Maggie är att utnyttja artificiell intelligens (AI) och Natural Language Processing (NLP) metoder för att utveckla en användarcentrerad app som underlättar tillgången och upptäckten av flerspråkigt kulturellt innehåll. Den avsedda publiken för Maggie är mycket varierande; appen skräddarsyr innehåll utifrån användarnas kunskaper och intressen för att tillgodose olika informationsbehov, från studenter till experter.
Maggie är resultatet av mer än ett decennium av forskningsverksamhet som inleddes 2012 med våra allra första experiment med språköverskridande informationssökning om kulturarv. Därefter markerade flera milstolpar vägen till Maggie, bland annat inrättandet av forskningsgruppen UNIOR NLP vid universitetet i Neapel L'Orientale 2016, och flera projekt från 2019 till 2021, däribland SMACH-projektet (Semantisk flerspråkig tillgång till kulturarv), ArchaeoTerm-projektet som erbjuder en resurs av arkeologiska termer som finns tillgängliga inom ramen för YourTerm CULT-projektet och NEAT-projektet (Named Entities in Archaeological Texts).
Varför valde du att använda datasetet Europeana.eu?
Vår forskargrupp har alltid varit engagerad i att göra kulturellt innehåll lättillgängligt för alla, genom att utveckla system och applikationer för kulturarv. I detta avseende har vi redan utnyttjat europeiska öppna data (i form av data från Europeanas webbplats) i flera verk, som alla syftar till att förbättra den senaste tekniken inom bearbetning av naturligt språk för bättre tillgång till kulturarvsinnehåll.
I alla dessa fall utgjordes kärnan i de data som vi använde av öppna data som skrapats från Europeanas sök-API, vilket gör det enkelt att få tillgång till och återanvända aggregerade data, samtidigt som uppgifternas höga kvalitet och flerspråkighet säkerställs. Även om mycket av den information som beskrivs i Europeanas datamodell (t.ex. data om lokalisering, författare och teman) i tidigare experiment inte användes för att utveckla Maggie, utnyttjar vi till fullo den rika informationskälla som Europeana erbjuder, eftersom vi syftade till att utveckla en mer specifik naturlig språkbehandlingsuppgift.

EU Datathon uppmuntrar till användning av öppna dataset. Varför är öppenhet av data viktigt för din forskning och app?
Öppna data säkerställer reproducerbarhet och öppenhet i forskningen. Tillgången till sådana uppgifter är ett sätt att uppmuntra kunskapsdelning och samarbete i forskarsamhället. De flesta av våra forskningsinsatser drar nytta av öppna data från flera källor. Detta är fallet med vår app Maggie. Utan öppna data från Europeana och data.europa.eu hade vi inte kunnat utveckla Maggie. Vi extraherar information om varje konstverk som görs tillgängligt genom Europeana, t.ex. dess upphovsman, skapandedatum och så vidare, och vi sammanställer informationen om dess geolokalisering från GeoDataset of data.europa.eu.
Varför valde du att delta i EU:s Datathon-tävling?
Det var en stor utmaning för oss när vi försökte samla alla våra tidigare insatser i en enda applikation som skulle kunna hjälpa människor att enkelt få tillgång till europeiskt kulturellt innehåll i dagens digitala tidsålder. Det innebar dock också en möjlighet att komma ur ren akademisk forskning och engagera sig i ett koncepttest som går utöver prototypstadiet, mot något som faktiskt kan användas i en verklig situation. samtidigt som man använder sig av toppmoderna metoder, resurser och verktyg inom bearbetning av naturligt språk och artificiell intelligens.
Vilka råd skulle du ge andra som deltar i en tävling som denna?
Att delta i tävlingar som främjar användningen av öppna data är ett sätt att stödja genomförandet, spridningen och antagandet av sådana data. Det bidrar också till förbättring och underhåll av dataset som på grund av mängden data och källor är svåra att hantera, rengöra och testa. Resultaten av dessa typer av tävlingar har en verklig inverkan på samhället, som är direkt kopplad till möjligheten att förbättra medborgarnas livskvalitet genom att göra information och kunskap om det samhälle de lever i tillgänglig och lättillgänglig. Vårt råd till forskare är att komma ur sin komfortzon och att kombinera forskningens stränghet med designprocessens kreativitet och tänka på den positiva inverkan på samhället som det slutliga målet.
