EuropeanaTech Challenge for Europeana AI/ML Datasets: Razglasitev zmagovalcev!

Objavljeno 22. marec 2021 po

Clemens Neudecker (Berlin State Library)

Metode s področja umetne inteligence in strojnega učenja so pripomogle k premikanju tehnoloških meja na različnih področjih, tudi v sektorju kulturne dediščine (nekaj primerov je v vmesnem poročilu EuropeanaTech AI v zvezi s projektno skupino GLAM in pobudo AI4LAM). Za spodbujanje inovacij na tem področju je EuropeanaTech pred nekaj tedni napovedal svoj prvi izziv za nabore podatkov o umetni inteligenci/ML Europeane. S to novo dejavnostjo smo želeli spodbuditi oblikovanje naborov podatkov za sektor GLAM, ki se lahko uporabljajo za umetno inteligenco/umetno inteligenco, pri čemer smo črpali iz bogatih virov kulturne dediščine, ki so na voljo v Europeani. Upamo, da bi lahko razpoložljivost takih naborov podatkov pripomogla k spodbujanju večjega sodelovanja z digitalnimi podatki o kulturni dediščini na področju umetne inteligence/ML in podprla prenos nedavnega napredka na področju umetne inteligence/ML na področje digitalnega kuratorstva in analize vsebin kulturne dediščine.

Prejeli smo skupno pet predlogov, ki so jih člani usmerjevalne skupine EuropeanaTech in skupine za umetno inteligenco skrbno pregledali v zvezi s projektno skupino GLAM. Predloge so ocenili na podlagi njihove relevantnosti za sektor GLAM (25 %), relevantnosti za umetno inteligenco/ML (25 %), povezave z Europeano (30 %) ter jasnosti opisa in delovnega načrta (20 %).

Razglasitev zmagovalcev

Imenovane entitete v arheoloških besedilih

Cilj tega predloga skupine s sedežem na Univerzi v Neaplju „L'Orientale“ je ustvariti nabor podatkov za prepoznavanje imenovanih subjektov (NER) in ekstrakcijo izrazov za arheološke izraze v italijanščini in angleščini v zbirki Europeana Archeology. NER je postopek identifikacije lastnih imen, kot so imena oseb ali lokacije v nestrukturiranem besedilu. Izraz ekstrakcija je podoben, vendar se osredotoča na iskanje specializiranih izrazov, v tem primeru z arheološkega področja. Upoštevani bodo besednjaki, kot sta Getty in CIDOC CRM. Končni nabor podatkov bi se lahko uporabil pri razvoju in ocenjevanju tehnologij, ki temeljijo na umetni inteligenci/ML, za NER na arheološkem področju.

Pregledovalci so zlasti cenili jasno strukturo in zrelost predloga, za katerega je bil že pripravljen vzorčni nabor podatkov z uporabo vmesnikov za aplikacijsko programiranje Europeane za preskušanje predlaganega pristopa. Posebej dragocena sta bila tudi dvojezični vidik in pomanjkanje podobnih odprtih virov za arheološko področje.

Zac Grace

Namen tega predloga študenta Ecole Nationale d'Ingénieurs de Tarbes je ustvariti maske slikovnih pik za semantično segmentacijo z ročnim označevanjem slikovnih podatkov v zbirki Europeana Fashion. To pomeni, da se na primer pri analizi slike ustrezni modni elementi (majica, hlače, čevlji) na sliki označijo z obrisi slikovnih pik. Takšni podatki se lahko uporabijo za usposabljanje avtomatiziranega sistema segmentacije.

Pregledovalcem sta bila všeč jasen obseg in razumevanje dela, potrebnega za izvajanje predloga. Menili so tudi, da ima veliko možnosti za uporabo v različnih zbirkah.

Korpus spornih kontekstov

Ta skupni predlog skupine za humanistične študije KNAW in Centrum Wiskunde & Informatica na Nizozemskem želi vzpostaviti obrazložen korpus spornih izrazov v kontekstu (ConConCor) iz nizozemskih časopisov v Europeani. Ti se lahko nato uporabijo za zagon in vrednotenje (pol)avtomatskih metod za odkrivanje takih izrazov v zbirkah kulturne dediščine. Sporni izrazi tukaj pomenijo tiste besede ali besedne zveze, ki namigujejo na določeno (implicitno ali eksplicitno) pristranskost do ali proti skupini, dogodku ali kako drugače.

Recenzenti so cenili, kako naj bi ta predlog obravnaval ključni cilj pri izzivu, odkrivanju etičnih vprašanj in pristranskosti, ki so neločljivo povezani z digitaliziranimi zbirkami kulturne dediščine.

Zmagovalcem bodo na voljo tri štipendije v višini 2 500 EUR, da bodo lahko uresničili svoje predloge in do konca junija 2021 predložili ustrezne nabore podatkov.

Izvedite več

Radi bi se zahvalili vsem, ki so podali predlog za ta izziv za njihovo trdo delo in odlične ideje. Veselimo se izvedbe zmagovalnih projektov in upamo, da se bo v prihodnosti odprl še en krog za tiste, ki tokrat niso bili uspešni!

Če bi radi izvedeli več o takih priložnostih in se povezali ter sodelovali z multidisciplinarnimi tehničnimi strokovnjaki z vsega sveta, se pridružite EuropeanaTechu prek združenja Europeana Network Association in spremljajte skupnost na Twitterju.

Ta objava je bila popravljena 16. aprila 21, da bi odražala podaljšan rok, v katerem morajo zmagovalci predložiti svoje nabore podatkov.

EuropeanaTech Challenge for Europeana AI/ML Datasets: Razglasitev zmagovalcev!

Deli

Razglasitev zmagovalcev

Izvedite več

Odkrijte povezano vsebino