Metody z oblasti umělé inteligence a strojového učení pomohly posunout technologické hranice v různých oblastech, včetně odvětví kulturního dědictví (některé příklady uvádí průběžná zpráva o umělé inteligenci EuropeanaTech v souvislosti s pracovní skupinou GLAM a iniciativa AI4LAM). Na podporu inovací v této oblasti oznámila EuropeanaTech před několika týdny svou první výzvu pro datové soubory AI/ML Europeany. Touto novou činností jsme chtěli stimulovat vytváření datových souborů pro odvětví GLAM, které lze využít pro AI/ML, a to na základě bohatých zdrojů kulturního dědictví dostupných v Europeaně. Doufáme, že dostupnost těchto datových souborů by mohla pomoci podpořit větší zapojení do dat digitálního kulturního dědictví v oblasti umělé inteligence a praní peněz a podpořit přenos nedávného pokroku v oblasti umělé inteligence a praní peněz do oblasti digitální kurátorství a analýzy obsahu kulturního dědictví.
Obdrželi jsme celkem pět návrhů, které byly pečlivě přezkoumány členy řídící skupiny EuropeanaTech a AI v souvislosti s pracovní skupinou GLAMs. Posuzovali návrhy na základě jejich relevance pro odvětví GLAM (25 %), relevance pro AI/ML (25 %), vztahu k Europeaně (30 %) a jasnosti popisu a pracovního plánu (20 %).
Vyhlášení vítězů
Pojmenované subjekty v archeologických textech
Tento návrh týmu z Neapolské univerzity "L'Orientale" má za cíl vytvořit datový soubor pro rozpoznávání pojmenovaných entit (NER) a extrakci termínů pro archeologické termíny v italštině a angličtině ve sbírce Europeana Archeology. NER je proces identifikace vlastních jmen, jako jsou jména osob nebo umístění v nestrukturovaném textu. Termín extrakce je podobný, ale zaměřuje se na nalezení specializovaných termínů, v tomto případě z oblasti archeologie. Budou zváženy slovníky jako Getty a CIDOC CRM. Konečný datový soubor by mohl být použit při vývoji a hodnocení technologií založených na AI/ML pro NER v oblasti archeologie.
Hodnotitelé ocenili zejména jasnou strukturu a vyspělost návrhu, pro který již byl vytvořen modelový datový soubor využívající rozhraní API Europeany k testování navrhovaného přístupu. Obzvláště cenný byl také dvojjazyčný aspekt a nedostatek podobných otevřených zdrojů pro archeologické pole.
Zac Grace
Tento návrh studenta Ecole Nationale d'Ingénieurs de Tarbes má za cíl vytvořit pixelové masky pro sémantickou segmentaci prostřednictvím ruční anotace obrazových dat ve sbírce Europeana Fashion. To znamená, že například při analýze obrázku jsou příslušné módní prvky (košile, kalhoty, boty) na obrázku označeny obrysy pixelů. Tyto údaje mohou být použity pro školení automatizovaného segmentačního systému.

Hodnotitelům se líbil jasný rozsah a pochopení práce potřebné k provedení návrhu. Také se domnívali, že má velký potenciál pro použití v různých sbírkách.
Korpus kontroverzních kontextů
Tento společný návrh KNAW Humanities Cluster a Centra Wiskunde & Informatica v Nizozemsku chce vytvořit komentovaný korpus sporných termínů v kontextu (ConConCor) z nizozemských novin v Europeaně. Ty pak mohou být použity k bootstrapu a vyhodnocení (polo)automatických metod pro detekci těchto termínů ve sbírkách kulturního dědictví. Sporné pojmy zde znamenají ta slova nebo fráze, které naznačují nějakou (implicitní nebo explicitní) zaujatost vůči nebo proti skupině, události nebo jinak.
Hodnotitelé ocenili, jak tento návrh usiluje o řešení klíčového cíle v této výzvě, tj. odhalování etických problémů a předsudků, které jsou nedílnou součástí digitalizovaných sbírek kulturního dědictví.
Vítězům budou dána k dispozici tři stipendia ve výši 2 500 EUR, aby mohli realizovat své návrhy a předložit příslušné soubory údajů do konce června 2021.
Zjistit více
Rádi bychom poděkovali všem, kteří předložili návrh na tuto výzvu, za jejich tvrdou práci a vynikající nápady. Těšíme se na realizaci vítězných projektů a doufáme, že se v budoucnu otevře další kolo pro ty, kteří tentokrát nebyli úspěšní!
Chcete-li se dozvědět více o takových příležitostech a navázat kontakty a spolupracovat s multidisciplinárními technickými odborníky z celého světa, připojte se k EuropeanaTech prostřednictvím sdružení Europeana Network Association a sledujte komunitu na Twitteru.
Tento příspěvek byl upraven dne 16. dubna 2021, aby odrážel prodlouženou lhůtu, v níž musí vítězové předložit své datové soubory.
