Datathon EÚ je každoročná súťaž, ktorá poskytuje „príležitosť pre nadšencov otvorených dát a vývojárov aplikácií z celého sveta, aby preukázali potenciál otvorených dát, zviditeľnili svoje inovatívne nápady na medzinárodnej úrovni a súťažili o svoj podiel na celkovom výhernom fonde vo výške 200 000 EUR a o cenu Public Choice Award.“ Vyzývame ich, aby využili data.europa.eu, oficiálny portál pre európske údaje, ktorý spravuje Úrad pre vydávanie publikácií Európskej únie.
Vďaka súboru údajov Europeana.eu uverejnenému na stránke data.europa.eu začiatkom tohto roka by zo súhrnných metaúdajov približne 4 000 inštitúcií správy kultúrneho dedičstva, ktoré poskytujú obsah Europeane, mohli mať prospech aj návrhy a aplikácie určené pre súťaž, pokiaľ ide o ich príspevky. Europeana ako oficiálny partner súťaže pozvala výskumníkov, univerzitných profesorov a študentov spoločenských a humanitných vied a počítačových a informačných vied, aby sa zúčastnili na Datathone EÚ.
Po dvoch kolách predbežného výberu 156 prihlášok z 38 krajín bol tím, ktorý vyvíja aplikáciu založenú na súbore údajov Europeana.eu, jedným z 12 finalistov a získal cenu 7 000 EUR v rámci výzvy č. 4: „Európa pripravená na digitálny vek“ na slávnostnom odovzdávaní cien, ktoré sa konalo 20. októbra 2022 v Bruseli. Tím je zložený z profesorky Johanny Montiovej; výskumná pracovníčka, Maria Pia di Buono; a dvaja doktorandi Gennaro Nolano a Giulia Speranza. Johanna Monti nám hovorí o skúsenostiach.
Môžete nám povedať o aplikácii, ktorú ste vyvinuli, a o procese jej vytvárania?
Vyvinuli sme Maggie, chatbot v reálnom čase, ktorý funguje ako virtuálny asistent, ktorý pomáha ľuďom pristupovať k európskemu kultúrnemu obsahu a objavovať ho. Ľudia môžu komunikovať s Maggie prostredníctvom otázok v prirodzenom jazyku a pýtať sa na európske kultúrne dedičstvo.
Hlavnou myšlienkou spoločnosti Maggie je využívanie metodík umelej inteligencie (AI) a spracovania prirodzeného jazyka (NLP) na vývoj aplikácie zameranej na používateľa, ktorá uľahčuje prístup k viacjazyčnému kultúrnemu obsahu a jeho objavovanie. Zamýšľané publikum Maggie je veľmi rôznorodé; aplikácia prispôsobuje obsah znalostiam a záujmom používateľov s cieľom uspokojiť rôzne informačné potreby, od študentov až po odborníkov.
Maggie je výsledkom viac ako desaťročnej výskumnej činnosti, ktorá sa začala v roku 2012 našimi prvými experimentmi v oblasti medzijazykového získavania informácií o kultúrnom dedičstve. Potom nás do Maggie priviedlo niekoľko míľnikov vrátane založenia výskumnej skupiny UNIOR NLP Univerzity v Neapole L'Orientale v roku 2016 a niekoľkých projektov od roku 2019 do roku 2021 vrátane projektu SMACH (Sémantický viacjazyčný prístup ku kultúrnemu dedičstvu), projektu ArchaeoTerm, ktorý ponúka zdroj archeologických termínov dostupných v rámci projektu YourTerm CULT, a projektu NEAT (Named Entities in Archaeological Texts).
Prečo ste sa rozhodli použiť súbor údajov Europeana.eu?
Naša výskumná skupina sa vždy usilovala o to, aby bol kultúrny obsah ľahko dostupný pre všetkých, a to prostredníctvom vývoja systémov a aplikácií pre kultúrne dedičstvo. V tomto zmysle sme už využili európske otvorené údaje (vo forme údajov z webového sídla Europeana) vo viacerých dielach zameraných na zlepšenie súčasných najmodernejších úloh spracovania prirodzeného jazyka v záujme lepšieho prístupu k obsahu kultúrneho dedičstva.
Vo všetkých týchto prípadoch boli jadrom údajov, ktoré sme použili, otvorené údaje zozbierané z rozhrania Europeana Search API, čo uľahčuje prístup k agregovaným údajom a ich opätovné použitie a zároveň zabezpečuje vysokú kvalitu údajov a ich viacjazyčnosť. Zatiaľ čo v predchádzajúcich experimentoch sa veľa informácií opísaných dátovým modelom Europeany (ako sú údaje o lokalizácii, autoroch a témach) nepoužilo na vývoj Maggie, naplno využívame bohatý zdroj informácií, ktoré ponúka Europeana, keďže sme sa zamerali na vypracovanie špecifickejšej úlohy spracovania prirodzeného jazyka.

Datathon EÚ podporuje využívanie otvorených súborov údajov. Prečo je otvorenosť údajov dôležitá pre váš výskum a aplikáciu?
Otvorené údaje zabezpečujú reprodukovateľnosť a transparentnosť výskumu. Dostupnosť takýchto údajov predstavuje spôsob, ako podporiť výmenu poznatkov a spoluprácu vo vedeckých komunitách. Väčšina našich výskumných snáh využíva otvorené dáta z viacerých zdrojov. To je prípad našej aplikácie Maggie. Bez otvorených údajov z Europeany a data.europa.eu by sme Maggie nemohli vyvinúť. Získavame informácie o každom umeleckom diele sprístupnenom prostredníctvom Europeany, ako je jeho autor, dátum vytvorenia atď., a zhromažďujeme informácie o jeho geolokalizácii z GeoDataset of data.europa.eu.
Prečo ste sa rozhodli zapojiť do súťaže EU Datathon?
Bola to pre nás veľká výzva, keďže sme sa snažili zhromaždiť všetky naše predchádzajúce snahy do jedinej aplikácie, ktorá by mohla ľuďom pomôcť ľahko získať prístup k európskemu kultúrnemu obsahu v dnešnom digitálnom veku. Predstavoval však aj príležitosť vymaniť sa z čisto akademického výskumu a zaviazať sa v koncepčnom dôkaze, ktorý presahuje fázu prototypu, k niečomu, čo by sa skutočne mohlo použiť v reálnej situácii; a to všetko s využitím najmodernejších metodík, zdrojov a nástrojov v oblasti spracovania prirodzeného jazyka a umelej inteligencie.
Akú radu by ste dali ostatným, ktorí by sa zapojili do takejto súťaže?
Zapojenie sa do súťaží, ktoré propagujú využívanie otvorených údajov, je spôsob, ako podporiť vykonávanie, šírenie a prijímanie takýchto údajov. Prispieva tiež k zlepšovaniu a údržbe súborov údajov, ktoré sa vzhľadom na množstvo údajov a zdrojov ťažko spravujú, čistia a testujú. Výsledky týchto typov súťaží majú skutočný vplyv na spoločnosť a priamo súvisia s možnosťou zlepšenia kvality života občanov tým, že sprístupňujú a ľahko sprístupňujú informácie a poznatky o spoločnosti, v ktorej žijú. Našou radou pre výskumníkov je dostať sa zo svojej komfortnej zóny a spojiť prísnosť výskumu s kreativitou procesu navrhovania, pričom konečným cieľom je premýšľať o priaznivom vplyve na spoločnosť.
