Informácie o hovore
Metódy z oblasti umelej inteligencie a strojového učenia pomohli posunúť technologické hranice v rôznych oblastiach vrátane odvetvia kultúrneho dedičstva (pozri príklady v priebežnej správe EuropeanaTech AI v súvislosti s pracovnou skupinou GLAM alebo iniciatívou AI4LAM).
Dohľad sa vykonáva nad mnohými metódami AI/ML, ktoré sú zaujímavé pre aplikácie v GLAM; Pracujú napríklad tak, že trénujú prediktor (ako neurónová sieť) pomocou základnej pravdy (ideálne a očakávané výstupy) alebo označených údajov, z ktorých sa metóda dokáže naučiť a odvodiť model. Aby sa model dobre zovšeobecnil a vykonal presné predpovede pre širokú škálu vstupov, jeho trénovacie údaje musia byť dostatočného objemu, kvality a reprezentatívne pre oblasť, z ktorej sa odoberajú vzorky. V opačnom prípade existuje riziko nadmerného prispôsobenia (model bude len dobre predpovedať vstupy, ktoré sú veľmi podobné trénovacím údajom) alebo zavedenia skreslenia, čo nielenže zníži všeobecnú uplatniteľnosť a výkonnosť modelu, ale môže mať aj eticky problematické alebo inak neúmyselné vedľajšie účinky.
Odvetvie GLAM má dobrú pozíciu na využívanie umelej inteligencie/ML v tom zmysle, že spracované a rôznorodé údaje v dostatočnom objeme, kvalite a rozmanitosti vo forme digitálnych zbierok GLAM (ako sú agregované údaje a údaje poskytované Europeanou) sú v súčasnosti široko dostupné na základe otvorených licencií. V súčasnosti chýba širšia dostupnosť súborov údajov z odvetvia GLAM, ktoré sú vhodné na priame použitie v kontexte výskumu a vývoja umelej inteligencie/ML. Dostupnosť takýchto otvorených súborov údajov by mohla nielen pomôcť podporiť väčšiu angažovanosť v oblasti digitálnych údajov o kultúrnom dedičstve v oblasti umelej inteligencie/ML, ale aj podporiť prenos nedávneho pokroku v oblasti umelej inteligencie/ML do oblasti digitálnej správy a analýzy obsahu kultúrneho dedičstva. Na druhej strane ďalší pokrok v oblasti umelej inteligencie/ML často ide ruka v ruke s vydaním nových vysokokvalitných súborov údajov.
EuropeanaTech preto vyzýva na predkladanie návrhov na zostavenie vhodných súborov údajov AI/ML, ktoré vychádzajú z rozsiahlych zbierok na webovom sídle Europeany. Hľadáme návrhy na vytvorenie veľkých, dobre zdokumentovaných súborov údajov, ktoré sú vytvorené na priame využívanie na účely umelej inteligencie/ML (ako je trénovanie modelu) a ktoré môžu byť verejne dostupné na príslušných online platformách na základe otvorených licencií.
Obom víťazným návrhom udelíme finančný príspevok vo výške 2 500 EUR na podporu tvorby, dokumentácie a uverejňovania súborov údajov. Víťazi budú vyzvaní, aby predstavili svoje príspevky na budúcom podujatí Europeany (online) a poskytli text na uverejnenie súvisiaci s ich výstupmi.
Ako podať prihlášku
Ak sa chcete prihlásiť, prečítajte si ďalej uvedené usmernenia k predkladaniu návrhov a predložte návrh do 15. februára 2021 do 23.59 hod. SEČ. Návrhy by mali obsahovať menej ako 1 500 slov:
Zamýšľaný obsah súboru údajov (z hľadiska objemu, druhov aktív, anotácie atď.)
Postup, ktorý ste zamýšľali použiť na vytvorenie súboru údajov
Ako je to relevantné pre umelú inteligenciu/ml.
Návrhy by mali obsahovať aj návrh možného prípadu použitia podporený vopred vyškoleným modelom s preukázaním alebo hodnotením jeho výsledkov. V prípade prijatia musí byť možné vytvoriť a sprístupniť súbor údajov a všetku potrebnú dokumentáciu a technické zdroje do 30. júna 2021.
Zbierky európskeho kultúrneho dedičstva sú zvyčajne predmetom predsudkov a zahŕňajú etické otázky. Hoci to môže mať negatívny vplyv na riešenia umelej inteligencie a strojového učenia, na odhalenie týchto problémov by sa mohla použiť aj umelá inteligencia a strojové učenie. Tieto problémy nemusia byť v rámci tejto výzvy prekonané, ale odporúčame vám ich zdokumentovať a prediskutovať.
Súbory údajov MUSIA:
byť čerpané z údajov obsiahnutých v rôznych zbierkach poskytovaných prostredníctvom Europeany;
Zahrňte len metaúdaje, ktoré ste vytvorili vy alebo ktoré pochádzajú z Europeany. Výsledné metaúdaje musia byť licencované podľa Creative Commons Zero;
byť zostavené v strojovo čitateľnom formáte vrátane dokumentácie a pôvodu;
Predtým neboli publikované. Ak sa už uverejnili, musia sa podrobne uviesť kroky, ako sa má nový súbor údajov vylepšiť a používať;
Uveďte opis jedného alebo viacerých prípadov zamýšľaného použitia súboru údajov.
Súbory údajov by mali:
zahŕňajú len mediálne aktíva s licenciou kompatibilnou s úrovňou obsahu 3 rámca Europeana Publishing Framework;
objasniť vzťah s najlepšími postupmi a najmodernejšími postupmi v oblasti umelej inteligencie a prania špinavých peňazí a ich prínos k nim v rámci digitálneho kultúrneho dedičstva;
Zahrnúť vopred vyškolený model vyplývajúci z uplatňovania (použitím základnej metódy prania špinavých peňazí a umelej inteligencie pre (jeden z) prípadov zamýšľaného použitia) a ukážku používania tohto modelu alebo vyhodnotenia jeho výsledkov;
Dokumentujte alebo diskutujte o potenciálnych etických otázkach a predsudkoch.
Súbory údajov MÔŽU:
zahrnúť ďalšie kurátorské obohatenia a zlepšenia, ako je anotácia údajov, označovanie alebo krížové odkazy s inými (digitálnymi) zdrojmi pod podmienkou, že sa dokončia pred uvoľnením súboru údajov a že sa uplatnia vhodné opatrenia na kontrolu kvality;
Tvorí súčasť publikácie v recenzovanom časopise alebo na konferencii.
Mala by sa poskytnúť základná dokumentácia pre technické riešenia a akýkoľvek vyrobený softvér musí byť uvoľnený pod licenciou s otvoreným zdrojovým kódom.
Kľúčové dátumy
Otvára sa výzva: 8. januára 2021
Uzávierka podávania prihlášok: februára 2021, 23:59 SEČ
Oznámenie o prijatí: 1. marec 2021
Uverejnenie súboru údajov: 30. júna 2021
Kritériá na vyhodnotenie ponúk
Príspevky preskúma pracovná skupina pre umelú inteligenciu EuropeanaTech v rámci GLAM a riadiaca skupina komunity EuropeanaTech na základe:
Relevantnosť prípadu použitia pre komunitu GLAM: 25%
Relevantnosť súboru údajov pre AI/ML vo vzťahu k prípadu použitia: 25%
Jasné vymedzenie prípadu použitia/demo vo vzťahu k Europeane: 30%
Jasnosť opisu vytvoreného súboru údajov: 20%
Oprávnenosť
Formálne sa finančné prostriedky nepridelia jednotlivcom, ale inštitúciám, ktorými môžu byť kultúrne dedičstvo alebo výskumné inštitúcie zahŕňajúce univerzity. Zástupca každej inštitúcie, ktorej bola udelená cena, bude požiadaný, aby podpísal subdodávateľskú zmluvu s nadáciou Europeana.
Uchádzači musia mať sídlo v členskom štáte EÚ.
Uchádzači musia byť členmi komunity EuropeanaTech a združenia Europeana Network Association. Ak ešte nie ste členom, môžete sa dozvedieť, ako sa pripojiť.
Priznanie je hrubá suma, preto zahŕňa DPH.
Partneri projektu Europeana DSI-4 nie sú oprávnení na financovanie. Úplný zoznam je k dispozícii tu.
Odporúčané čítanie
Táto stránka bola upravená 19. januára 2021 s cieľom zohľadniť predĺženie lehoty z 31. januára 2021 na 15. februára 2021. Bol upravený 16. apríla 2021 s cieľom zohľadniť predĺženú lehotu pre víťazov na dodanie súborov údajov do júna 2021.
