A mesterséges intelligencia (MI) és a gépi tanulás (ML) területén alkalmazott módszerek számos területen segítettek kitolni a technológiai határokat, többek között a kulturális örökség ágazatában is (az EuropeanaTech AI GLAM-munkacsoporttal kapcsolatos időközi jelentése és az AI4LAM kezdeményezés néhány példát említ). Az innováció ezen a területen történő ösztönzése érdekében az EuropeanaTech néhány héttel ezelőtt bejelentette az Europeana mesterségesintelligencia-/ML-adatkészletekkel kapcsolatos első kihívását. Ezzel az új tevékenységgel a GLAM-ágazat számára olyan adatkészletek létrehozását szerettük volna ösztönözni, amelyek felhasználhatók a mesterséges intelligencia/ML céljaira, felhasználva az Europeanában rendelkezésre álló gazdag kulturális örökségi erőforrásokat. Reméljük, hogy az ilyen adatkészletek rendelkezésre állása elősegítheti a digitális kulturális örökségre vonatkozó adatokkal való nagyobb mértékű együttműködést a mesterséges intelligenciában/ML-ben, és támogathatja a mesterséges intelligencia/ML terén a közelmúltban elért eredményeknek a digitális gondozás és a kulturális örökségi tartalmak elemzése területére való átvitelét.
Összesen öt javaslatot kaptunk, amelyeket az EuropeanaTech irányítócsoport és a mesterséges intelligencia tagjai alaposan áttekintettek a GLAM-munkacsoporttal kapcsolatban. A javaslatokat a következők alapján értékelték: a GLAM-ágazat szempontjából való relevanciájuk (25%), a mesterséges intelligencia/ML szempontjából való relevanciájuk (25%), az Europeanához való viszonyuk (30%), valamint a leírás és a munkaterv egyértelműsége (20%).
A nyertesek kihirdetése
Megnevezett entitások a régészeti szövegekben
A Nápolyi Egyetem "L'Orientale" nevű kutatócsoportjának javaslatának célja, hogy az Europeana régészeti gyűjteményében létrehozzon egy adatkészletet az Elnevezett entitások felismeréséhez (NER) és a Régészeti kifejezések kivonatolásához olasz és angol nyelven. A NER a strukturálatlan szövegben szereplő tulajdonnevek, például személynevek vagy helyek azonosításának folyamata. A Term Extraction hasonló, de a speciális szakkifejezések megtalálására összpontosít, ebben az esetben a régészeti területről. Az olyan szókincseket, mint a Getty és a CIDOC CRM, figyelembe veszik. A végleges adatkészlet felhasználható a NER mesterséges intelligencián/ML-en alapuló technológiáinak fejlesztéséhez és értékeléséhez a régészet területén.
A felülvizsgálók különösen nagyra értékelték a javaslat egyértelmű szerkezetét és érettségét, amelyre vonatkozóan a javasolt megközelítés tesztelésére már elkészítettek egy modelladatkészletet az Europeana API-inak felhasználásával. Különösen értékesnek tartották a kétnyelvűséget és a hasonló nyitott régészeti források szűkösségét is.
Zac Grace
Az Ecole Nationale d'Ingénieurs de Tarbes egyik hallgatójának javaslata pixelmaszkok létrehozására irányul a szemantikai szegmentációhoz, az Europeana Fashion gyűjtemény képadatainak kézi megjegyzése révén. Ez azt jelenti, hogy például egy kép elemzésekor a kép releváns divatelemeit (ing, nadrág, cipő) a kép képpont-körvonalaival jelölik meg. Ezek az adatok felhasználhatók egy automatizált szegmentációs rendszer betanítására.

A felülvizsgálók kedvelték a javaslat végrehajtásához szükséges munka egyértelmű hatókörét és megértését. Azt is gondolták, hogy sok lehetőség van a különböző gyűjteményekben való alkalmazásra.
A vitás kontextusok Corpus
A KNAW Humanities Cluster és a Centrum Wiskunde & Informatica (Hollandia) közös javaslata az Europeana holland újságjaiból származó vitatott kifejezések magyarázó jegyzetekkel ellátott korpuszát (ConConCor) kívánja létrehozni. Ezek ezután felhasználhatók a kulturális örökség gyűjteményeiben az ilyen kifejezések észlelésére szolgáló (fél)automatikus módszerek elindítására és értékelésére. A vitatott kifejezések itt olyan szavakat vagy kifejezéseket jelentenek, amelyek valamilyen (implicit vagy explicit) elfogultságra utalnak egy csoport, esemény vagy más iránt vagy ellen.
Az értékelők értékelték, hogy a javaslat hogyan kívánja kezelni a kihívás egyik fő célkitűzését, a digitalizált kulturális örökségi gyűjteményekben rejlő etikai kérdések és elfogultságok feltárását.
Három, egyenként 2500 EUR összegű ösztöndíjat bocsátanak a nyertesek rendelkezésére javaslataik végrehajtása és a megfelelő adatkészletek 2021. június végéig történő rendelkezésre bocsátása érdekében.
Tudjon meg többet
Köszönetünket fejezzük ki mindazoknak, akik javaslatot tettek erre a kihívásra kemény munkájukért és kiváló ötleteikért. Várakozással tekintünk a nyertes projektek megvalósítása elé, és reméljük, hogy a jövőben újabb forduló nyílik azok számára, akik ezúttal nem jártak sikerrel!
Ha szeretne többet megtudni az ehhez hasonló lehetőségekről, és szeretne hálózatba kapcsolódni, valamint együttműködni a világ minden tájáról érkező multidiszciplináris műszaki szakemberekkel, csatlakozzon az EuropeanaTech-hez az Europeana Hálózati Szövetségen keresztül, és kövesse a közösséget a Twitteren.
Ezt a bejegyzést 2021. április 16-án szerkesztettük, hogy tükrözze a nyertesek számára az adatkészleteik benyújtására rendelkezésre álló meghosszabbított határidőt.
