EU Datathon to coroczny konkurs, który stanowi „szansę dla entuzjastów otwartych danych i twórców aplikacji z całego świata, aby zademonstrować potencjał otwartych danych, uzyskać międzynarodową widoczność swoich innowacyjnych pomysłów i konkurować o swój udział w całkowitym funduszu nagród w wysokości 200 000 EUR oraz w nagrodzie publiczności”. Zachęca się ich do korzystania z data.europa.eu, oficjalnego portalu danych europejskich, zarządzanego przez Urząd Publikacji Unii Europejskiej.
Dzięki zbiorowi danych Europeana.eu opublikowanemu na początku tego roku na stronie data.europa.eu, gromadzącemu metadane z około 4 000 instytucji dziedzictwa kulturowego, które dostarczają treści do Europeany, wnioski i aplikacje opracowane na potrzeby konkursu mogłyby również skorzystać z tego zbioru na potrzeby swoich zgłoszeń. Jako oficjalny partner konkursu Europeana zaprosiła naukowców, profesorów uniwersyteckich i studentów nauk społecznych i humanistycznych oraz informatyki i informatyki do udziału w EU Datathon.
Po dwóch rundach wstępnej selekcji 156 zgłoszeń z 38 krajów zespół, który opracowuje aplikację opartą na zbiorze danych Europeana.eu, został jednym z 12 finalistów i otrzymał nagrodę w wysokości 7 000 euro w ramach wyzwania nr 4: „Europa na miarę ery cyfrowej” podczas ceremonii wręczenia nagród, która odbyła się w Brukseli 20 października 2022 r. W skład zespołu wchodzi prof. Johanna Monti; badaczka, Maria Pia di Buono; oraz dwóch doktorantów, Gennaro Nolano i Giulia Speranza. Johanna Monti opowiada nam o tym doświadczeniu.
Czy możesz nam powiedzieć o aplikacji, którą opracowałeś i procesie jej tworzenia?
Opracowaliśmy Maggie, chatbota działającego w czasie rzeczywistym, który działa jako wirtualny asystent pomagający ludziom w dostępie do europejskich treści kulturowych i ich odkrywaniu. Ludzie mogą kontaktować się z Maggie za pomocą pytań dotyczących języka naturalnego i zadawać pytania na temat europejskiego dziedzictwa kulturowego.
Główną ideą Maggie jest wykorzystanie metodologii sztucznej inteligencji (AI) i przetwarzania języka naturalnego (NLP) w celu opracowania aplikacji zorientowanej na użytkownika, która ułatwia dostęp i odkrywanie wielojęzycznych treści kulturowych. Zamierzona publiczność Maggie jest bardzo zróżnicowana; aplikacja dostosowuje treści dotyczące wiedzy i zainteresowań użytkowników, aby zaspokoić różne potrzeby informacyjne, od studentów po ekspertów.
Maggie jest wynikiem ponad dekady działań badawczych, które rozpoczęły się w 2012 r. od naszych pierwszych eksperymentów w zakresie wyszukiwania informacji międzyjęzykowych na temat dziedzictwa kulturowego. Następnie kilka kamieni milowych utorowało nam drogę do Maggie, w tym utworzenie grupy badawczej UNIOR NLP Uniwersytetu Neapolitańskiego L'Orientale w 2016 r. oraz kilka projektów w latach 2019–2021, w tym projekt SMACH (Semantyczny Wielojęzyczny Dostęp do Dziedzictwa Kulturowego), projekt ArchaeoTerm, który oferuje zasób terminów archeologicznych dostępnych w ramach projektu YourTerm CULT, oraz projekt NEAT (Nazwane Podmioty w Tekstach Archeologicznych).
Dlaczego zdecydowali się Państwo skorzystać ze zbioru danych Europeana.eu?
Nasza grupa badawcza zawsze dążyła do tego, aby treści kulturowe były łatwo dostępne dla wszystkich, opracowując systemy i aplikacje dla dziedzictwa kulturowego. W tym sensie wykorzystaliśmy już europejskie otwarte dane (w formie danych ze strony internetowej Europeana) w kilku pracach, z których wszystkie miały na celu poprawę obecnych najnowocześniejszych zadań w zakresie przetwarzania języka naturalnego w celu lepszego dostępu do treści dziedzictwa kulturowego.
We wszystkich tych przypadkach rdzeń danych wykorzystywanych przez Trybunał stanowiły otwarte dane pobrane z interfejsu API wyszukiwania Europeana, co ułatwia dostęp do zagregowanych danych i ich ponowne wykorzystywanie, a jednocześnie zapewnia wysoką jakość danych i ich wielojęzyczność. Podczas gdy w poprzednich eksperymentach wiele informacji opisanych w modelu danych Europeany (takich jak dane o lokalizacji, autorach i tematach) nie zostało wykorzystanych do opracowania Maggie, w pełni wykorzystujemy bogate źródło informacji oferowane przez Europeanę, ponieważ dążyliśmy do opracowania bardziej szczegółowego zadania przetwarzania języka naturalnego.

EU Datathon zachęca do korzystania z otwartych zbiorów danych. Dlaczego otwartość danych jest ważna dla Twoich badań i aplikacji?
Otwarte dane zapewniają odtwarzalność i przejrzystość badań. Dostępność takich danych stanowi sposób zachęcania do dzielenia się wiedzą i współpracy w środowiskach naukowych. Większość naszych wysiłków badawczych wykorzystuje otwarte dane z kilku źródeł. Tak jest w przypadku naszej aplikacji Maggie. Bez otwartych danych z Europeany i data.europa.eu nie moglibyśmy opracować Maggie. Uzyskujemy informacje o każdym dziele udostępnionym za pośrednictwem Europeany, takie jak jego autor, data powstania itp., a także agregujemy informacje o jego geolokalizacji z GeoDataset of data.europa.eu.
Dlaczego zdecydowali się Państwo wziąć udział w konkursie EU Datathon?
Było to dla nas duże wyzwanie, ponieważ staraliśmy się zebrać wszystkie nasze wcześniejsze wysiłki w jednej aplikacji, która mogłaby pomóc ludziom w łatwym dostępie do europejskich treści kulturowych w dzisiejszej erze cyfrowej. Stanowiło to jednak również okazję do wyjścia z czysto akademickich badań i zaangażowania się w weryfikację poprawności projektu, która wykracza poza etap prototypu, w kierunku czegoś, co może być faktycznie wykorzystane w rzeczywistej sytuacji; przy jednoczesnym wykorzystaniu najnowocześniejszych metod, zasobów i narzędzi w zakresie przetwarzania języka naturalnego i sztucznej inteligencji.
Jaką radę dałbyś innym biorącym udział w takim konkursie?
Udział w konkursach promujących wykorzystanie otwartych danych jest sposobem wspierania wdrażania, rozpowszechniania i przyjmowania takich danych. Przyczynia się również do poprawy i utrzymania zbiorów danych, które ze względu na ilość danych i źródeł są trudne do zarządzania, czyszczenia i testowania. Wyniki tego typu konkursów mają realny wpływ na społeczeństwo, bezpośrednio związany z możliwością poprawy jakości życia obywateli, poprzez udostępnianie i udostępnianie informacji i wiedzy na temat społeczeństwa, w którym żyją. Doradzamy naukowcom, aby wydostali się ze swojej strefy komfortu i połączyli rygor badań z kreatywnością procesu projektowania, myśląc o korzystnym wpływie na społeczeństwo jako ostatecznym celu.
