O hovoru
Metody z oblasti umělé inteligence a strojového učení (AI/ML) pomohly posunout technologické hranice v různých oblastech, včetně odvětví kulturního dědictví (viz příklady v průběžné zprávě o umělé inteligenci EuropeanaTech v souvislosti s pracovní skupinou GLAM nebo iniciativou AI4LAM).
Mnoho metod AI/ML, které jsou zajímavé pro aplikace v GLAM, je pod dohledem; Pracují například tak, že trénují prediktor (jako neuronovou síť) pomocí základní pravdy (ideální a očekávané výstupy) nebo označených dat, ze kterých je metoda schopna se učit a odvodit model. Aby model mohl dobře zobecnit a provádět přesné předpovědi pro širokou škálu vstupů, musí mít jeho tréninkové údaje dostatečný objem, kvalitu a musí být reprezentativní pro oblast, z níž je vzorkován. V opačném případě existuje riziko nadměrného přizpůsobení (model bude pouze dobře předpovídat vstupy, které jsou velmi podobné tréninkovým údajům) nebo zavedení předpojatosti, což nejen sníží obecnou použitelnost a výkonnost modelu, ale může také vést k eticky problematickým nebo jinak nezamýšleným vedlejším účinkům.
Odvětví GLAM má dobré postavení pro využívání umělé inteligence a praní peněz v tom smyslu, že kurátorská a různorodá data v dostatečném objemu, kvalitě a rozmanitosti v podobě digitálních sbírek z GLAM (jako jsou agregovaná a poskytovaná Europeanou) jsou nyní široce dostupná pod otevřenými licencemi. V současné době chybí širší dostupnost datových souborů z odvětví GLAM, které jsou vhodné pro přímé použití v souvislosti s výzkumem a vývojem v oblasti umělé inteligence a praní peněz. Dostupnost těchto otevřených datových souborů by mohla nejen pomoci podpořit větší zapojení do dat digitálního kulturního dědictví v oblasti UI/ML, ale také podpořit přenos nedávného pokroku v oblasti UI/ML do oblasti digitální kurátorství a analýzy obsahu kulturního dědictví. Na druhé straně jde další pokrok v oblasti umělé inteligence a praní peněz často ruku v ruce s vydáváním nových vysoce kvalitních datových souborů.
EuropeanaTech proto vyzývá k předložení návrhů na sestavení vhodných datových souborů AI/ML, které by vycházely z rozsáhlých sbírek na internetových stránkách Europeany. Hledáme návrhy na vytvoření velkých, dobře zdokumentovaných datových souborů, které jsou vytvořeny pro přímé využití pro účely AI/ML (např. školení modelu) a které mohou být zveřejněny na příslušných online platformách pod otevřenými licencemi.
Oběma vítězným návrhům poskytneme finanční stipendium ve výši 2 500 EUR na podporu výroby, dokumentace a zveřejňování datových souborů. Vítězové budou vyzváni, aby představili své příspěvky na budoucí (online) akci Europeany a poskytli text k publikaci týkající se jejich výstupů.
Jak podat přihlášku
Chcete-li podat přihlášku, přečtěte si níže uvedené pokyny k předkládání návrhů a předložte návrh do 15. února 2021, 23:59 SEČ. Návrhy by měly obsahovat méně než 1 500 slov:
Zamýšlený obsah datového souboru (z hlediska objemu, typů aktiv, anotace atd.)
Postup, který jste zamýšleli použít při vytváření souboru údajů
Jak je to důležité pro AI / ML.
Návrhy by měly rovněž obsahovat návrh možného případu použití, který bude podpořen předem vyškoleným modelem s demonstrací nebo vyhodnocením jeho výsledků. V případě přijetí musí být možné vytvořit a uvolnit datový soubor a veškerou nezbytnou dokumentaci a technické zdroje do 30. června 2021.
Sbírky evropského kulturního dědictví jsou obvykle předpojaté a jsou spojeny s etickými otázkami. I když to může mít negativní dopad na řešení v oblasti umělé inteligence a strojového učení, umělá inteligence a strojové učení by mohly být rovněž použity k odhalení těchto problémů. Tyto problémy nemusí být v rámci této výzvy vyřešeny, ale doporučujeme, abyste je zdokumentovali a projednali.
Soubory údajů MUSÍ:
vycházet z údajů obsažených v různých sbírkách poskytovaných prostřednictvím Europeany;
Zahrňte pouze metadata, která jste vytvořili vy nebo která pocházejí z Europeany. Výsledná metadata musí být licencována v rámci Creative Commons Zero;
být sepsány ve strojově čitelném formátu, včetně dokumentace a provenience;
Dříve nebyly publikovány. Pokud byl dříve zveřejněn, musí být podrobně popsány kroky, jak má být nový soubor údajů zlepšen a používán;
Uveďte popis jednoho nebo více zamýšlených případů použití souboru údajů.
Soubory údajů by měly:
zahrnovat pouze mediální prostředky s licencí kompatibilní s obsahem úrovně 3 rámce Europeana Publishing Framework;
vyjasnit vztah a přínos k osvědčeným postupům v oblasti umělé inteligence a praní peněz a nejmodernějším technologiím v rámci digitálního kulturního dědictví;
zahrnout předtrénovaný model vyplývající z použití (pomocí základní metody ML/AI pro (jeden z) případů zamýšleného použití) a ukázku použití tohoto modelu nebo vyhodnocení jeho výsledků;
Dokumentovat nebo diskutovat o potenciálních etických otázkách a předsudcích.
Datové soubory mohou:
zahrnout další kurátorská obohacení a zlepšení, jako je anotace údajů, označování nebo křížové odkazy s jinými (digitálními) zdroji, za podmínky, že jsou dokončena před uvolněním souboru údajů a že jsou uplatněna vhodná opatření ke kontrole kvality;
Tvoří součást publikace v recenzovaném časopise nebo na konferenci.
Měla by být poskytnuta základní dokumentace pro technická řešení a veškerý vytvořený software musí být uvolněn pod licencí s otevřeným zdrojovým kódem.
Klíčová data
Otevře se výzva: ledna 2021
Lhůta pro podání přihlášek: února 2021, 23:59 SEČ
Oznámení o přijetí: března 2021
Zveřejnění datového souboru: června 2021
Kritéria pro zadání zakázky
Příspěvky budou přezkoumány pracovní skupinou EuropeanaTech AI v rámci GLAMs a řídící skupinou komunity EuropeanaTech na základě:
Význam případu použití pro komunitu GLAM: 25%
Relevantnost souboru údajů pro AI/ML ve vztahu k případu použití: 25%
Jasná definice případu/dema použití ve vztahu k Europeaně: 30%
Jasnost v popisu souboru údajů: 20%
Způsobilost
Formálně nebudou finanční prostředky přidělovány jednotlivcům, ale institucím, které mohou být kulturním dědictvím nebo výzkumnými institucemi zahrnujícími univerzity. Zástupce každé instituce, která je příjemcem grantu, bude požádán, aby podepsal subdodavatelskou smlouvu s nadací Europeana.
Žadatelé musí mít sídlo v členském státě EU.
Žadatelé musí být členy EuropeanaTech komunity a Europeana Network Association. Pokud ještě nejste členem, můžete zjistit, jak se připojit.
Přiznání je hrubá částka, a proto zahrnuje DPH.
Partneři projektu Europeana DSI-4 nejsou způsobilí pro financování. Úplný seznam je k dispozici zde.
Doporučené čtení
Tato stránka byla upravena 19. ledna 2021, aby odrážela prodloužení lhůty z 31. ledna 2021 na 15. února 2021. Byla upravena dne 16. dubna 2021, aby odrážela prodlouženou lhůtu, v níž musí vítězové předložit své datové soubory do června 2021.
