Metody z dziedziny sztucznej inteligencji (AI) i uczenia maszynowego (ML) pomogły przesuwać granice technologiczne w różnych dziedzinach, w tym w sektorze dziedzictwa kulturowego (przykładowe przykłady przedstawiono w sprawozdaniu okresowym EuropeanaTech AI w odniesieniu do grupy zadaniowej GLAM i inicjatywy AI4LAM). Aby zachęcić do innowacji w tej dziedzinie, kilka tygodni temu EuropeanaTech ogłosiła swoje pierwsze wyzwanie dla zbiorów danych AI/ML Europeany. Dzięki temu nowemu działaniu chcieliśmy stymulować tworzenie zbiorów danych dla sektora GLAM, które można wykorzystać do celów AI/ML, korzystając z bogatych zasobów dziedzictwa kulturowego dostępnych w Europeanie. Mamy nadzieję, że dostępność takich zbiorów danych mogłaby przyczynić się do zwiększenia zaangażowania w cyfrowe dane dotyczące dziedzictwa kulturowego w dziedzinie AI/ML i wesprzeć transfer najnowszych postępów w dziedzinie AI/ML do dziedziny cyfrowej kuracji i analizy treści dziedzictwa kulturowego.
Otrzymaliśmy łącznie pięć wniosków, które zostały starannie przeanalizowane przez członków grupy sterującej EuropeanaTech i AI w odniesieniu do grupy zadaniowej GLAM. Ocenili wnioski na podstawie ich znaczenia dla sektora GLAM (25 %), znaczenia dla AI/ML (25 %), związku z Europeaną (30 %) oraz jasności opisu i planu prac (20 %).
Ogłoszenie zwycięzców
Nazwane podmioty w tekstach archeologicznych
Ta propozycja zespołu z Uniwersytetu Neapolitańskiego "L'Orientale" ma na celu stworzenie zbioru danych do rozpoznawania nazw podmiotów (NER) i ekstrakcji terminów dla terminów archeologicznych w języku włoskim i angielskim w kolekcji archeologii Europeana. NER to proces identyfikacji nazwisk własnych, takich jak nazwiska osób lub lokalizacje w nieustrukturyzowanym tekście. Termin Ekstrakcja jest podobny, ale koncentruje się na znalezieniu specjalistycznych terminów, w tym przypadku z dziedziny archeologii. Rozważone zostaną słowniki takie jak Getty i CIDOC CRM. Ostateczny zbiór danych mógłby zostać wykorzystany do opracowania i oceny technologii opartych na AI/ML dla NER w dziedzinie archeologii.
Recenzenci szczególnie docenili jasną strukturę i dojrzałość wniosku, w odniesieniu do którego opracowano już udawany zbiór danych z wykorzystaniem API Europeany w celu przetestowania proponowanego podejścia. Aspekt dwujęzyczny i niedobór podobnych otwartych zasobów dla dziedziny archeologii były również postrzegane jako szczególnie cenne.
Zac Grace
Ta propozycja studenta Ecole Nationale d'Ingénieurs de Tarbes ma na celu stworzenie masek pikselowych do segmentacji semantycznej, poprzez ręczną adnotację danych obrazu w kolekcji Europeana Fashion. Oznacza to, że na przykład podczas analizy obrazu odpowiednie elementy mody (koszula, spodnie, buty) na obrazie są następnie oznaczone zarysami pikseli. Takie dane można wykorzystać do szkolenia zautomatyzowanego systemu segmentacji.

Oceniającym podobał się jasny zakres i zrozumienie prac wymaganych do wdrożenia wniosku. Uważali również, że ma duży potencjał do zastosowania w różnych kolekcjach.
Konteksty kontrowersyjne Corpus
Ta wspólna propozycja Klastra Humanistycznego KNAW i Centrum Wiskunde & Informatica w Holandii ma na celu stworzenie skomentowanego zbioru spornych terminów w kontekście (ConConCor) z holenderskich gazet w Europeanie. Można je następnie wykorzystać do uruchamiania i oceny (pół)automatycznych metod wykrywania takich terminów w kolekcjach dziedzictwa kulturowego. Terminy kontrowersyjne oznaczają tutaj te słowa lub frazy, które sugerują pewne (dorozumiane lub wyraźne) uprzedzenia wobec lub przeciwko grupie, zdarzeniu lub w inny sposób.
Recenzenci docenili sposób, w jaki niniejszy wniosek ma na celu osiągnięcie kluczowego celu w tym wyzwaniu, jakim jest wykrywanie problemów etycznych i uprzedzeń nieodłącznie związanych ze zdigitalizowanymi kolekcjami dziedzictwa kulturowego.
Zwycięzcom zostaną udostępnione trzy stypendia w wysokości 2500 euro każda w celu wdrożenia ich propozycji i dostarczenia odpowiednich zbiorów danych do końca czerwca 2021 r.
Dowiedz się więcej
Chcielibyśmy podziękować wszystkim, którzy zgłosili się do tego wyzwania za ich ciężką pracę i doskonałe pomysły. Z niecierpliwością czekamy na realizację zwycięskich projektów i mamy nadzieję, że kolejna runda otworzy się w przyszłości dla tych, którzy tym razem nie odnieśli sukcesu!
Jeśli chcesz dowiedzieć się więcej o takich możliwościach i nawiązać współpracę z multidyscyplinarnymi specjalistami technicznymi z całego świata, dołącz do EuropeanaTech za pośrednictwem Europeana Network Association i obserwuj społeczność na Twitterze.
Ten post został edytowany w dniu 16 kwietnia 2021 r., aby odzwierciedlić przedłużony termin dostarczenia zbiorów danych przez zwycięzców.
