Datathon EU je každoroční soutěž, která poskytuje „příležitost nadšencům do otevřených dat a vývojářům aplikací z celého světa demonstrovat potenciál otevřených dat, zviditelnit své inovativní nápady na mezinárodní úrovni a soutěžit o svůj podíl na celkovém fondu cen ve výši 200 000 EUR a o cenu Public Choice Award.“ Vyzýváme je, aby využili data.europa.eu, oficiální portál pro evropská data spravovaný Úřadem pro publikace Evropské unie.
Díky datovému souboru Europeana.eu zveřejněnému na stránkách data.europa.eu počátkem tohoto roku, který shromažďuje metadata od přibližně 4 000 institucí kulturního dědictví, které poskytují obsah pro Europeanu, by z něj mohly mít prospěch i návrhy a aplikace navržené pro tuto soutěž. Jako oficiální partner soutěže pozvala Europeana výzkumné pracovníky, univerzitní profesory a studenty společenských a humanitních věd a informatiky k účasti na Datathonu EU.
Po dvou kolech předběžného výběru 156 přihlášek z 38 zemí byl tým, který vyvíjí aplikaci založenou na datovém souboru Europeana.eu, jedním z 12 finalistů a získal cenu ve výši 7 000 EUR v rámci výzvy č. 4: „Evropa připravená na digitální věk“ na slavnostním předávání cen, které se konalo v Bruselu dne 20. října 2022. Tým se skládá z profesorky Johanny Montiové; výzkumná pracovnice, Maria Pia di Buono; a dva doktorandi, Gennaro Nolano a Giulia Speranza. Johanna Monti nám vypráví o této zkušenosti.
Můžete nám říct o aplikaci, kterou jste vyvinuli, a o procesu jejího vytváření?
Vyvinuli jsme Maggie, chatbota v reálném čase, který funguje jako virtuální asistent, který pomáhá lidem získat přístup k evropskému kulturnímu obsahu a objevovat jej. Lidé mohou komunikovat s Maggie prostřednictvím otázek přirozeného jazyka a ptát se na evropské kulturní dědictví.
Hlavní myšlenkou Maggie je využití metod umělé inteligence (AI) a zpracování přirozeného jazyka (NLP) k vývoji aplikace zaměřené na uživatele, která usnadňuje přístup a objevování vícejazyčného kulturního obsahu. Zamýšlené publikum Maggie je velmi rozmanité; aplikace přizpůsobuje obsah znalostem a zájmům uživatelů, aby uspokojila různé informační potřeby, od studentů až po odborníky.
Maggie je výsledkem více než desetileté výzkumné činnosti, která byla zahájena v roce 2012 našimi prvními experimenty v oblasti vyhledávání mezijazykových informací o kulturním dědictví. Poté nás do Maggie přivedlo několik milníků, včetně založení výzkumné skupiny UNIOR NLP Univerzity v Neapoli L'Orientale v roce 2016 a několik projektů od roku 2019 do roku 2021, včetně projektu SMACH (Sémantický vícejazyčný přístup ke kulturnímu dědictví), projektu ArchaeoTerm, který nabízí zdroj archeologických termínů dostupných v rámci projektu YourTerm CULT, a projektu NEAT (Jmenované subjekty v archeologických textech).
Proč jste se rozhodli používat datový soubor Europeana.eu?
Naše výzkumná skupina se vždy zasazovala o to, aby byl kulturní obsah snadno přístupný všem, a to vývojem systémů a aplikací pro kulturní dědictví. V tomto smyslu jsme již využili evropská otevřená data (ve formě dat z internetových stránek Europeany) v několika dílech, jejichž cílem je zlepšit současný stav techniky zpracování přirozeného jazyka pro lepší přístup k obsahu kulturního dědictví.
Ve všech těchto případech bylo jádro údajů, které jsme použili, reprezentováno otevřenými údaji získanými z rozhraní Europeana Search API, což usnadňuje přístup k souhrnným údajům a jejich opakované použití a zároveň zajišťuje vysokou kvalitu údajů a jejich mnohojazyčnost. Zatímco v předchozích experimentech nebyla velká část informací popsaných v datovém modelu Europeany (jako jsou údaje o lokalizaci, autorech a tématech) použita k vývoji Maggie, plně využíváme bohatý zdroj informací nabízených Europeanou, protože jsme se zaměřili na vývoj konkrétnějšího úkolu zpracování přirozeného jazyka.

Datathon EU podporuje používání otevřených datových souborů. Proč je otevřenost dat důležitá pro váš výzkum a aplikaci?
Otevřená data zajišťují reprodukovatelnost a transparentnost ve výzkumu. Dostupnost těchto údajů představuje způsob, jak podpořit sdílení znalostí a spolupráci ve vědeckých komunitách. Většina našich výzkumných snah využívá otevřená data z několika zdrojů. To je případ naší aplikace Maggie. Bez otevřených dat z Europeany a data.europa.eu bychom Maggie nemohli vyvinout. Získáváme informace o každém uměleckém díle zpřístupněném prostřednictvím Europeany, jako je jeho autor, datum vytvoření atd., a shromažďujeme informace o jeho geolokaci ze souboru GeoDataset of data.europa.eu.
Proč jste se rozhodli zúčastnit soutěže EU Datathon?
Byla to pro nás velká výzva, protože jsme se snažili shromáždit veškeré své předchozí úsilí do jediné aplikace, která by mohla lidem pomoci snadno získat přístup k evropskému kulturnímu obsahu v dnešním digitálním věku. Představovalo však také příležitost vystoupit z čistě akademického výzkumu a zavázat se k ověření koncepce, která přesahuje fázi prototypu, k něčemu, co by mohlo být skutečně použito v reálné situaci; to vše s využitím nejmodernějších metodik, zdrojů a nástrojů v oblasti zpracování přirozeného jazyka a umělé inteligence.
Jakou radu byste dal ostatním, kteří by se zúčastnili takové soutěže?
Účast v soutěžích, které podporují využívání veřejně přístupných dat, je způsobem, jak podpořit zavádění, šíření a přijímání těchto dat. Přispívá také ke zlepšení a údržbě datových souborů, které je vzhledem k množství dat a zdrojů obtížné spravovat, čistit a testovat. Výsledky těchto typů soutěží mají skutečný dopad na společnost, který přímo souvisí s možností zlepšit kvalitu života občanů tím, že informace a znalosti o společnosti, ve které žijí, jsou přístupné a snadno dostupné. Naše rada výzkumným pracovníkům je dostat se ze své komfortní zóny a spojit přísnost výzkumu s kreativitou procesu návrhu a přemýšlet o příznivém dopadu na společnost jako o konečném cíli.
