Tehisintellekti ja masinõppe valdkonna meetodid on aidanud nihutada tehnoloogilisi piire eri valdkondades, sealhulgas kultuuripärandi sektoris (mõned näited on EuropeanaTechi tehisintellekti vahearuanne seoses GLAMide rakkerühma ja algatusega AI4LAM). Innovatsiooni edendamiseks selles valdkonnas kuulutas EuropeanaTech mõni nädal tagasi välja oma esimese väljakutse Europeana tehisintellekti/rahapesu andmestikele. Selle uue tegevusega tahtsime ergutada selliste andmekogumite loomist GLAM-sektori jaoks, mida saab kasutada tehisintellekti/rahanduse jaoks, kasutades Europeanas kättesaadavaid rikkalikke kultuuripärandi ressursse. Loodame, et selliste andmekogumite kättesaadavus võib aidata edendada digitaalse kultuuripärandi andmete suuremat kaasamist tehisintellekti/rahandussektorisse ning toetada tehisintellekti/rahandussektori hiljutiste edusammude ülekandmist kultuuripärandi sisu digitaalse hooldamise ja analüüsimise valdkonda.
Saime kokku viis ettepanekut, mille EuropeanaTechi juhtrühma ja tehisintellekti liikmed vaatasid hoolikalt läbi seoses GLAMide rakkerühmaga. Nad hindasid ettepanekuid selle põhjal, kui olulised need on üleilmse rände ja liikuvuse sektori jaoks (25 %), tehisintellekti/rahandussektori jaoks (25 %), seoses Europeanaga (30 %) ning kui selged on kirjeldus ja töökava (20 %).
Võitjate väljakuulutamine
Nimega üksused arheoloogilistes tekstides
Napoli ülikoolis asuva meeskonna "L'Orientale" ettepaneku eesmärk on luua Europeana arheoloogia kogusse andmestik nimeliste üksuste tunnustamiseks (NER) ja terminite kaevandamiseks arheoloogiliste terminite jaoks itaalia ja inglise keeles. NER on õigete nimede, näiteks isikunimede või asukohtade identifitseerimise protsess struktureerimata tekstis. Termini kaevandamine on sarnane, kuid keskendub spetsiaalsete terminite leidmisele, antud juhul arheoloogia valdkonnast. Arvesse võetakse selliseid sõnastikke nagu Getty ja CIDOC CRM. Lõplikku andmekogumit võiks kasutada uute osalejate jaoks tehisintellektil/rahapesul põhinevate tehnoloogiate arendamiseks ja hindamiseks arheoloogia valdkonnas.
Läbivaatajad hindasid eriti ettepaneku selget ülesehitust ja küpsust, mille kohta on Europeana rakendusliideste abil juba koostatud näidisandmestik kavandatud lähenemisviisi katsetamiseks. Eriti väärtuslikuks peeti ka kakskeelset aspekti ja sarnaste avatud ressursside nappust arheoloogia valdkonnas.
Zac Grace
Selle Ecole Nationale d'Ingénieurs de Tarbesi üliõpilase ettepaneku eesmärk on luua pikslimaskid semantiliseks segmenteerimiseks, kasutades Europeana Fashioni kollektsiooni pildiandmete manuaalset annoteerimist. See tähendab, et näiteks kujutise analüüsimisel märgistatakse kujutise asjakohased moeelemendid (särk, püksid, kingad) piksli piirjoontega. Selliseid andmeid saab kasutada automaatse segmenteerimissüsteemi treenimiseks.

Läbivaatajatele meeldis ettepaneku rakendamiseks vajaliku töö selge ulatus ja mõistmine. Samuti arvasid nad, et sellel on palju potentsiaali erinevate kollektsioonide jaoks.
Vaieldavad kontekstid Corpus
See KNAW Humanities Clusteri ja Centrum Wiskunde & Informatica ühisettepanek Madalmaades soovib luua Europeana Hollandi ajalehtedest konteksti (ConConCor) selgitustega vastuoluliste terminite kogumi. Seejärel saab neid kasutada kultuuripärandi kogudes selliste terminite tuvastamise (pool)automaatsete meetodite käivitamiseks ja hindamiseks. Vaidlusalused terminid tähendavad siin neid sõnu või fraase, mis viitavad mingile (kaudsele või otsesele) kallutatusele grupi, sündmuse või muu poole või vastu.
Hindajad hindasid seda, kuidas käesoleva ettepaneku eesmärk on tegeleda selle probleemi põhieesmärgiga, milleks on digiteeritud kultuuripärandi kogudele omaste eetiliste probleemide ja kallutatuse avastamine.
Võitjatele tehakse kättesaadavaks kolm 2500 euro suurust stipendiumi, et nad saaksid oma ettepanekud ellu viia ja esitada vastavad andmekogumid 2021. aasta juuni lõpuks.
Uuri lähemalt
Soovime tänada kõiki, kes esitasid sellele väljakutsele oma raske töö ja suurepäraste ideede eest ettepaneku. Ootame võiduprojektide elluviimist ja loodame, et tulevikus avatakse veel üks voor neile, kes seekord ei olnud edukad!
Kui soovite kuulda rohkem selliseid võimalusi ja luua võrgustikke ning teha koostööd multidistsiplinaarsete tehniliste spetsialistidega kogu maailmast, liituge EuropeanaTechiga Europeana Network Associationi kaudu ja jälgige kogukonda Twitteris.
Seda postitust toimetati 16. aprillil 2021, et kajastada võitjate andmekogumite esitamise pikendatud tähtaega.
