Metodes mākslīgā intelekta (MI) un mašīnmācīšanās (ML) jomā ir palīdzējušas paplašināt tehnoloģiskās robežas dažādās jomās, tostarp kultūras mantojuma nozarē (daži piemēri ir EuropeanaTech AI starpposma ziņojums saistībā ar GLAM darba grupu un AI4LAM iniciatīvu). Lai veicinātu inovāciju šajā jomā, pirms dažām nedēļām EuropeanaTech paziņoja par savu pirmo uzdevumu attiecībā uz Europeana MI/ML datu kopām. Ar šo jauno darbību mēs vēlējāmies stimulēt tādu GLAM nozares datu kopu izveidi, kuras var izmantot MI/ML vajadzībām, izmantojot Europeana pieejamos bagātīgos kultūras mantojuma resursus. Mēs ceram, ka šādu datu kopu pieejamība varētu palīdzēt veicināt lielāku iesaisti ar digitālā kultūras mantojuma datiem MI/ML jomā un atbalstīt neseno MI/ML sasniegumu pārnešanu uz kultūras mantojuma satura digitālās pārzināšanas un analīzes jomu.
Mēs saņēmām kopumā piecus priekšlikumus, kurus rūpīgi izskatīja EuropeanaTech vadības grupas un MI locekļi saistībā ar GLAM darba grupu. Viņi novērtēja priekšlikumus, pamatojoties uz to atbilstību GLAM nozarei (25 %), atbilstību MI/ML (25 %), saistību ar Europeana (30 %) un apraksta un darba plāna skaidrību (20 %).
Uzvarētāju paziņošana
Nosauktās vienības arheoloģiskajos tekstos
Šī Neapoles Universitātes "L'Orientale" komandas priekšlikuma mērķis ir Europeana arheoloģijas kolekcijā izveidot datu kopu nosaukto vienību atpazīšanai (NER) un terminu izguvei arheoloģiskiem terminiem itāļu un angļu valodā. NER ir process, kurā nestrukturētā tekstā tiek identificēti personvārdi, piemēram, personu vārdi vai atrašanās vietas. Termins Extraction ir līdzīgs, bet koncentrējas uz specializētu terminu atrašanu, šajā gadījumā no arheoloģijas jomas. Tiks apsvērtas tādas vārdnīcas kā Getty un CIDOC CRM. Galīgo datu kopu varētu izmantot MI/ML tehnoloģiju izstrādē un izvērtēšanā attiecībā uz NER arheoloģijas jomā.
Pārskatītāji jo īpaši atzinīgi novērtēja priekšlikuma skaidro struktūru un briedumu, attiecībā uz kuru jau tika izveidota paraugdatu kopa, izmantojot Europeana API, lai pārbaudītu ierosināto pieeju. Par īpaši vērtīgu tika uzskatīts arī divvalodu aspekts un līdzīgu atvērto resursu trūkums arheoloģijas jomā.
Zac Grace
Šī Ecole Nationale d'Ingénieurs de Tarbes studenta priekšlikuma mērķis ir izveidot pikseļu maskas semantiskai segmentācijai, manuāli anotējot attēlu datus Europeana Fashion kolekcijā. Tas nozīmē, ka, piemēram, analizējot attēlu, attiecīgie modes elementi (krekls, bikses, apavi) attēlā tiek marķēti ar pikseļu kontūrām. Šādus datus var izmantot automatizētas segmentācijas sistēmas apmācībai.

Pārskatītājiem patika skaidra darbības joma un izpratne par darbu, kas nepieciešams priekšlikuma īstenošanai. Viņi arī domāja, ka tam ir liels potenciāls pielietot dažādās kolekcijās.
Strīdīgie konteksti Korpuss
Šis KNAW Humanitāro zinātņu kopas un Centrum Wiskunde & Informatica Nīderlandē kopīgais priekšlikums vēlas izveidot anotētu strīdīgu terminu kopumu kontekstā (ConConCor) no Nīderlandes laikrakstiem Europeana. Pēc tam tos var izmantot, lai bootstrap un novērtētu (daļēji) automātiskas metodes šādu terminu atklāšanai kultūras mantojuma kolekcijās. Strīdīgi termini šeit nozīmē tos vārdus vai frāzes, kas liecina par kādu (netiešu vai nepārprotamu) neobjektivitāti pret vai pret grupu, notikumu vai citādi.
Pārskatītāji atzinīgi novērtēja to, kā šā priekšlikuma mērķis ir risināt galveno problēmas mērķi, atklāt ētikas jautājumus un neobjektivitāti, kas raksturīga digitalizētām kultūras mantojuma kolekcijām.
Uzvarētājiem būs pieejamas trīs stipendijas, katra 2500 EUR apmērā, lai īstenotu viņu priekšlikumus un līdz 2021. gada jūnija beigām iesniegtu attiecīgās datu kopas.
Uzzināt vairāk
Mēs vēlamies izteikt pateicību visiem, kas iesniedza priekšlikumu šim izaicinājumam, par viņu smago darbu un lieliskajām idejām. Ar nepacietību gaidām uzvarējušo projektu īstenošanu un ceram, ka nākotnē atvērsies vēl viena kārta tiem, kuri šoreiz neguva panākumus!
Ja vēlaties uzzināt vairāk par šādām iespējām un sadarboties ar daudzdisciplīnu tehniskajiem speciālistiem no visas pasaules, pievienojieties EuropeanaTech ar Europeana Network asociācijas starpniecību un sekojiet kopienai tviterī.
Šis amats tika rediģēts 16.04.21., lai atspoguļotu pagarināto termiņu, kurā uzvarētājiem jāiesniedz savas datu kopas.
