EU Datathon este un concurs anual care oferă „o șansă entuziaștilor de date deschise și dezvoltatorilor de aplicații din întreaga lume de a demonstra potențialul datelor deschise, de a obține vizibilitate internațională pentru ideile lor inovatoare și de a concura pentru cota care le revine din fondul total de premii în valoare de 200 000 EUR și din Premiul publicului”. Aceștia sunt invitați să utilizeze data.europa.eu, portalul oficial pentru date europene, gestionat de Oficiul pentru Publicații al Uniunii Europene.
Cu setul de date Europeana.eu publicat pe data.europa.eu la începutul acestui an, agregarea metadatelor de la cele aproximativ 4 000 de instituții de patrimoniu cultural care furnizează conținut Europeana, propunerile și aplicațiile concepute pentru concurs ar putea beneficia, de asemenea, de acesta pentru înscrierile lor. În calitate de partener oficial al concursului, Europeana a invitat cercetători, profesori universitari și studenți de la Științe Sociale și Umaniste și Informatică să participe la EU Datathon.
După două runde de preselecție a 156 de înscrieri din 38 de țări, o echipă care dezvoltă o aplicație bazată pe setul de date Europeana.eu a fost una dintre cele 12 finaliste și a primit un premiu de 7 000 de euro în cadrul provocării nr. 4: „O Europă pregătită pentru era digitală” în cadrul ceremoniei de decernare a premiilor care a avut loc la Bruxelles la 20 octombrie 2022. Echipa este compusă din prof. Johanna Monti; cercetător, Maria Pia di Buono; și doi doctoranzi, Gennaro Nolano și Giulia Speranza. Johanna Monti ne povestește despre această experiență.
Ne puteți spune despre aplicația pe care ați dezvoltat-o și despre procesul de creare a acesteia?
Am dezvoltat Maggie, un chatbot în timp real care funcționează ca un asistent virtual pentru a ajuta oamenii să acceseze și să descopere conținutul cultural european. Oamenii pot interacționa cu Maggie prin întrebări legate de limbajul natural și pot întreba despre patrimoniul cultural european.
Ideea principală din spatele Maggie este exploatarea inteligenței artificiale (AI) și a metodologiilor de procesare a limbajului natural (NLP) pentru a dezvolta o aplicație centrată pe utilizator, care facilitează accesul și descoperirea conținutului cultural multilingv. Publicul vizat de Maggie este foarte divers; aplicația adaptează conținutul privind cunoștințele și interesele utilizatorilor pentru a satisface diferite nevoi de informare, de la studenți la experți.
Maggie este rezultatul a peste un deceniu de activități de cercetare care au început în 2012 cu primele noastre experimente în domeniul extragerii de informații interlingvistice privind patrimoniul cultural. După aceea, mai multe etape importante ne-au marcat drumul către Maggie, inclusiv înființarea grupului de cercetare UNIOR NLP al Universității din Napoli L’Orientale în 2016 și mai multe proiecte din 2019 până în 2021, inclusiv proiectul SMACH (Accesul multilingv semantic la patrimoniul cultural), proiectul ArchaeoTerm care oferă o resursă de termeni arheologici disponibili în cadrul proiectului YourTerm CULT și proiectul NEAT (Entități desemnate în textele arheologice).
De ce ați decis să utilizați setul de date Europeana.eu?
Grupul nostru de cercetare s-a angajat întotdeauna să facă conținutul cultural ușor accesibil pentru toată lumea, prin dezvoltarea de sisteme și aplicații pentru patrimoniul cultural. În acest sens, am exploatat deja datele deschise europene (sub formă de date de pe site-ul web Europeana) în mai multe lucrări, toate menite să îmbunătățească sarcinile actuale de ultimă generație în materie de prelucrare a limbajului natural pentru un acces mai bun la conținutul patrimoniului cultural.
În toate aceste cazuri, nucleul datelor pe care le-am utilizat a fost reprezentat de datele deschise extrase din API-ul Europeana Search, ceea ce facilitează accesarea și reutilizarea datelor agregate, asigurând, în același timp, calitatea ridicată a datelor și multilingvitatea acestora. În timp ce în experimentele anterioare o mare parte din informațiile descrise de modelul de date Europeana (cum ar fi datele despre localizare, autori și teme) nu au fost utilizate pentru a dezvolta Maggie, exploatăm pe deplin sursa bogată de informații oferită de Europeana, deoarece ne-am propus să dezvoltăm o sarcină mai specifică de procesare a limbajului natural.

EU Datathon încurajează utilizarea seturilor de date deschise. De ce este importantă deschiderea datelor pentru cercetarea și aplicația dvs.?
Datele deschise asigură reproductibilitatea și transparența în cercetare. Disponibilitatea acestor date reprezintă o modalitate de a încuraja schimbul de cunoștințe și cooperarea în cadrul comunităților științifice. Cele mai multe dintre eforturile noastre de cercetare profită de datele deschise din mai multe surse. Acesta este cazul aplicației noastre Maggie. Fără datele deschise de la Europeana și data.europa.eu, nu am fi putut dezvolta Maggie. Extragem informații despre fiecare operă de artă pusă la dispoziție prin intermediul Europeana, cum ar fi autorul, data creării și așa mai departe, și agregăm informațiile despre geolocalizarea acesteia din GeoDataset of data.europa.eu.
De ce ați decis să participați la concursul EU Datathon?
A fost o mare provocare pentru noi, deoarece am încercat să reunim toate eforturile noastre anterioare într-o singură aplicație care ar putea ajuta oamenii să acceseze cu ușurință conținutul cultural european în era digitală de astăzi. Cu toate acestea, ea a reprezentat, de asemenea, o oportunitate de a ieși din cercetarea pur academică și de a se angaja într-o dovadă a conceptului care depășește stadiul de prototip, către ceva care ar putea fi efectiv utilizat într-o situație reală; toate acestea, utilizând metodologii, resurse și instrumente de ultimă generație în domeniul prelucrării limbajului natural și al inteligenței artificiale.
Ce sfat le-ai da celor care se inscriu intr-o astfel de competitie?
Participarea la concursuri care promovează utilizarea datelor deschise este o modalitate de a sprijini punerea în aplicare, răspândirea și adoptarea unor astfel de date. De asemenea, contribuie la îmbunătățirea și întreținerea seturilor de date care, din cauza cantității de date și de surse, sunt dificil de gestionat, de curățat și de testat. Rezultatele acestor tipuri de concursuri au un impact real asupra societății, direct legat de posibilitatea îmbunătățirii calității vieții cetățenilor, făcând accesibile și ușor accesibile informațiile și cunoștințele despre societatea în care trăiesc. Sfatul nostru pentru cercetători este să iasă din zona lor de confort și să combine rigoarea cercetării cu creativitatea procesului de proiectare, gândindu-se la impactul benefic asupra societății ca obiectiv final.
