“EU Datathon” ir ikgadējs konkurss, kas “dod iespēju atklāto datu entuziastiem un lietojumprogrammu izstrādātājiem no visas pasaules demonstrēt atvērto datu potenciālu, iegūt savu inovatīvo ideju starptautisku atpazīstamību un sacensties par savu daļu kopējā balvu fondā 200 000 EUR apmērā un balvu sabiedrības izvēlē”. Viņi tiek aicināti izmantot data.europa.eu – oficiālo Eiropas datu portālu, ko pārvalda Eiropas Savienības Publikāciju birojs.
Tā kā Europeana.eu datu kopa šā gada sākumā tika publicēta data.europa.eu, aptuveni 4000 kultūras mantojuma iestāžu, kas nodrošina Europeana saturu, metadatu apkopošana varētu būt noderīga arī konkursam izstrādātajiem priekšlikumiem un lietotnēm. Kā oficiālais konkursa partneris Europeana uzaicināja pētniekus, universitāšu profesorus un studentus no sociālajām un humanitārajām zinātnēm, kā arī datorzinātnes un informācijas zinātni piedalīties EU Datathon.
Pēc divām priekšatlases kārtām, kurās tika atlasīti 156 pieteikumi no 38 valstīm, komanda, kas izstrādā lietotni, kuras pamatā ir Europeana.eu datu kopa, bija viena no 12 finālistiem, un tai tika piešķirta balva 7000 EUR apmērā 4. uzdevuma ietvaros: “Digitālajam laikmetam gatava Eiropa” apbalvošanas ceremonijā, kas notika Briselē 2022. gada 20. oktobrī. Komandā ir profesore Johanna Monti; pētniece Maria Pia di Buono; un divi doktorantūras studenti — Gennaro Nolano un Giulia Speranza. Johanna Monti stāsta mums par pieredzi.
Vai varat mums pastāstīt par jūsu izstrādāto lietotni un tās izveides procesu?
Mēs izstrādājām Maggie, reāllaika sarunbotu, kas darbojas kā virtuāls palīgs, lai palīdzētu cilvēkiem piekļūt Eiropas kultūras saturam un to atklāt. Cilvēki var sazināties ar Maggie, izmantojot dabiskās valodas jautājumus un jautāt par Eiropas kultūras mantojumu.
Maggie galvenā ideja ir izmantot mākslīgā intelekta (MI) un dabiskās valodas apstrādes (NLP) metodes, lai izstrādātu uz lietotāju vērstu lietotni, kas atvieglo piekļuvi daudzvalodu kultūras saturam un tā atklāšanu. Maggie paredzētā auditorija ir ļoti daudzveidīga; lietotne pielāgo saturu lietotāju zināšanām un interesēm, lai apmierinātu dažādas informācijas vajadzības — no studentiem līdz ekspertiem.
Maggie ir vairāk nekā desmit gadu pētījumu rezultāts, kas sākās 2012. gadā ar mūsu pirmajiem eksperimentiem starpkultūru informācijas izguvē par kultūras mantojumu. Pēc tam vairāki atskaites punkti iezīmēja mūsu ceļu uz Maggie, tostarp Neapoles L'Orientale universitātes UNIOR NLP pētniecības grupas izveide 2016. gadā un vairāki projekti no 2019. līdz 2021. gadam, tostarp projekts SMACH (Semantiska daudzvalodu piekļuve kultūras mantojumam), projekts ArchaeoTerm, kas piedāvā arheoloģisko terminu resursu, kas pieejams projekta YourTerm CULT ietvaros, un projekts NEAT (Named entities in Archaeological Texts).
Kāpēc nolēmāt izmantot Europeana.eu datu kopu?
Mūsu pētniecības grupa vienmēr ir bijusi apņēmības pilna padarīt kultūras saturu viegli pieejamu ikvienam, izstrādājot kultūras mantojuma sistēmas un lietojumprogrammas. Šajā ziņā mēs jau esam izmantojuši Eiropas atvērtos datus (datu veidā no Europeana tīmekļa vietnes) vairākos darbos, kuru mērķis ir uzlabot pašreizējos modernos dabiskās valodas apstrādes uzdevumus, lai uzlabotu piekļuvi kultūras mantojuma saturam.
Visos šajos gadījumos mūsu izmantoto datu pamatā bija atvērtie dati, kas izgūti no Europeana Search API, kas atvieglo piekļuvi apkopotajiem datiem un to atkalizmantošanu, vienlaikus nodrošinot arī datu augstu kvalitāti un to daudzvalodību. Lai gan iepriekšējos eksperimentos liela daļa Europeana datu modelī aprakstītās informācijas (piemēram, dati par lokalizāciju, autoriem un tēmām) netika izmantota, lai izstrādātu Maggie, mēs pilnībā izmantojam Europeana piedāvāto bagātīgo informācijas avotu, jo mūsu mērķis bija izstrādāt konkrētāku dabiskās valodas apstrādes uzdevumu.

EU Datathon mudina izmantot atvērto datu kopas. Kāpēc datu atvērtība ir svarīga jūsu pētniecībai un lietotnei?
Atklātie dati nodrošina reproducējamību un pārredzamību pētniecībā. Šādu datu pieejamība ir veids, kā veicināt zināšanu apmaiņu un sadarbību zinātnieku kopienās. Lielākā daļa mūsu pētniecības centienu izmanto atklātos datus no vairākiem avotiem. Tas ir gadījums ar mūsu app Maggie. Bez atvērtajiem datiem no Europeana un data.europa.eu mēs nebūtu varējuši izstrādāt Maggie. Mēs izgūstam informāciju par katru mākslas darbu, kas darīts pieejams, izmantojot Europeana, piemēram, tā autoru, radīšanas datumu utt., un mēs apkopojam informāciju par tā ģeolokāciju no GeoDataset of data.europa.eu.
Kāpēc nolēmāt piedalīties konkursā “EU Datathon”?
Tas mums bija liels izaicinājums, jo mēs centāmies apkopot visus savus iepriekšējos centienus vienā lietojumprogrammā, kas varētu palīdzēt cilvēkiem viegli piekļūt Eiropas kultūras saturam mūsdienu digitālajā laikmetā. Tomēr tā bija arī iespēja izkļūt no tīri akadēmiskiem pētījumiem un koncepcijas pierādīšanā, kas sniedzas tālāk par prototipa posmu, pievērsties kaut kam, ko faktiski varētu izmantot reālās pasaules situācijā; vienlaikus izmantojot mūsdienīgas metodikas, resursus un rīkus dabiskās valodas apstrādē un mākslīgajā intelektā.
Kādus padomus jūs dotu citiem, kas piedalās šādā konkursā?
Pievienošanās konkursiem, kas veicina atvērto datu izmantošanu, ir veids, kā atbalstīt šādu datu ieviešanu, izplatīšanu un pieņemšanu. Tas arī palīdz uzlabot un uzturēt datu kopas, kuras datu un avotu apjoma dēļ ir grūti pārvaldīt, tīrīt un testēt. Šāda veida konkursu rezultātiem ir reāla ietekme uz sabiedrību, kas ir tieši saistīta ar iespēju uzlabot iedzīvotāju dzīves kvalitāti, padarot pieejamu un viegli pieejamu informāciju un zināšanas par sabiedrību, kurā viņi dzīvo. Mūsu padoms pētniekiem ir izkļūt no savas komforta zonas un apvienot pētniecības stingrību ar dizaina procesa radošumu, domājot par labvēlīgo ietekmi uz sabiedrību kā galīgo mērķi.
