Metódy z oblasti umelej inteligencie (AI) a strojového učenia (ML) pomohli posunúť technologické hranice v rôznych oblastiach vrátane odvetvia kultúrneho dedičstva (priebežná správa EuropeanaTech AI v súvislosti s pracovnou skupinou GLAM a iniciatíva AI4LAM poskytujú niekoľko príkladov). S cieľom podporiť inovácie v tejto oblasti spoločnosť EuropeanaTech pred niekoľkými týždňami oznámila svoju prvú výzvu pre súbory údajov Europeany o umelej inteligencii/ML. Touto novou aktivitou sme chceli stimulovať vytváranie súborov údajov pre sektor GLAM, ktoré možno použiť pre umelú inteligenciu/ML, pričom sme čerpali z bohatých zdrojov kultúrneho dedičstva dostupných v Europeane. Dúfame, že dostupnosť takýchto súborov údajov by mohla pomôcť podporiť väčšiu angažovanosť v oblasti digitálnych údajov o kultúrnom dedičstve v oblasti umelej inteligencie/ML a podporiť prenos nedávneho pokroku v oblasti umelej inteligencie/ML do oblasti digitálnej správy a analýzy obsahu kultúrneho dedičstva.
Dostali sme spolu päť návrhov, ktoré dôkladne preskúmali členovia riadiacej skupiny EuropeanaTech a umelej inteligencie v súvislosti s pracovnou skupinou GLAM. Posúdili návrhy na základe ich relevantnosti pre odvetvie GLAM (25 %), relevantnosti pre umelú inteligenciu/ML (25 %), vzťahu k Europeane (30 %) a jasnosti opisu a pracovného plánu (20 %).
Vyhlásenie víťazov
Pomenované entity v archeologických textoch
Cieľom tohto návrhu tímu z Univerzity v Neapole "L'Orientale" je vytvoriť súbor údajov pre rozpoznávanie pomenovaných entít (NER) a extrakciu termínov pre archeologické termíny v taliančine a angličtine v archeologickej zbierke Europeany. NER je proces identifikácie vlastných mien, ako sú mená osôb alebo miesta v neštruktúrovanom texte. Termín Extrakcia je podobný, ale zameriava sa na nájdenie špecializovaných termínov, v tomto prípade z oblasti archeológie. Zohľadnia sa slovníky ako Getty a CIDOC CRM. Konečný súbor údajov by sa mohol použiť pri vývoji a hodnotení technológií založených na umelej inteligencii/ML pre NER v archeologickej oblasti.
Hodnotitelia ocenili najmä jasnú štruktúru a vyspelosť návrhu, v prípade ktorého sa už vytvoril simulovaný súbor údajov s použitím API Europeany na testovanie navrhovaného prístupu. Dvojjazyčný aspekt a nedostatok podobných otvorených zdrojov pre oblasť archeológie sa tiež považovali za mimoriadne cenné.
Zac Grace
Cieľom tohto návrhu študentky Ecole Nationale d'Ingénieurs de Tarbes je vytvoriť pixelové masky na sémantické segmentovanie prostredníctvom manuálnej anotácie obrazových údajov v kolekcii Europeana Fashion. To znamená, že napríklad pri analýze obrazu sa príslušné módne prvky (košeľa, nohavice, topánky) na obrázku označia ich obrysmi pixelov. Takéto údaje sa môžu použiť na školenie automatizovaného systému segmentácie.

Recenzentom sa páčil jasný rozsah a pochopenie práce potrebnej na vykonávanie návrhu. Tiež si mysleli, že má veľký potenciál pre použitie v rôznych zbierkach.
Sporné súvislosti Corpus
Tento spoločný návrh KNAW Humanities Cluster a Centra Wiskunde & Informatica v Holandsku chce vytvoriť anotovaný korpus sporných pojmov v kontexte (ConConCor) z holandských novín v Europeane. Tie sa potom môžu použiť na zavádzanie a hodnotenie (polo)automatických metód odhaľovania takýchto pojmov v zbierkach kultúrneho dedičstva. Sporné výrazy tu znamenajú tie slová alebo frázy, ktoré naznačujú nejakú (implicitnú alebo explicitnú) zaujatosť voči alebo proti skupine, udalosti alebo inak.
Hodnotitelia ocenili, ako sa tento návrh zameriava na riešenie kľúčového cieľa v rámci výzvy, odhaľovanie etických otázok a predsudkov, ktoré sú neoddeliteľnou súčasťou digitalizovaných zbierok kultúrneho dedičstva.
Víťazi budú mať k dispozícii tri štipendiá vo výške 2 500 EUR, aby mohli realizovať svoje návrhy a dodať príslušné súbory údajov do konca júna 2021.
Ďalšie informácie
Radi by sme poďakovali všetkým, ktorí predložili návrh na túto výzvu za ich tvrdú prácu a vynikajúce nápady. Tešíme sa na realizáciu víťazných projektov a dúfame, že v budúcnosti sa otvorí ďalšie kolo pre tých, ktorí tentoraz neboli úspešní!
Ak by ste sa chceli dozvedieť viac o takýchto príležitostiach a spolupracovať s multidisciplinárnymi technickými odborníkmi z celého sveta, pridajte sa k EuropeanaTech prostredníctvom združenia Europeana Network Association a sledujte komunitu na Twitteri.
Tento príspevok bol upravený 16. apríla 2021 s cieľom zohľadniť predĺženú lehotu pre víťazov na doručenie ich súborov údajov.
