За обаждането
Методите от областта на изкуствения интелект и машинното самообучение (ИИ/ML) спомогнаха за преодоляване на технологичните граници в различни области, включително в сектора на културното наследство (вж. примерите в междинния доклад на EuropeanaTech AI във връзка с работната група за GLAM или инициативата AI4LAM).
Много методи на ИИ/СО, които представляват интерес за приложенията в ГЛАМ, са обект на надзор; например, те работят чрез обучение на предиктор (като невронна мрежа), използвайки основна истина (идеални и очаквани резултати) или етикетирани данни, от които методът е в състояние да научи и изведе модел. За да може моделът да обобщава добре и да извършва точни прогнози за широк спектър от входящи данни, неговите данни за обучение трябва да бъдат с достатъчен обем, качество и представителност за областта, от която се вземат проби. В противен случай съществува риск от прекомерно приспособяване (моделът ще прави добри прогнози само за входящи данни, които са много сходни с данните от обучението) или от въвеждане на предубеждения, което не само ще намали общата приложимост и ефективност на модела, но може също така да доведе до етични проблеми или други нежелани странични ефекти.
Секторът на GLAM е в добра позиция за внедряването на ИИ/ML, в смисъл че подбраните и разнообразни данни с достатъчен обем, качество и разнообразие под формата на цифрови колекции от GLAM (като тези, обобщени и предоставени от Europeana), вече са широко достъпни под отворени лицензи. Това, което понастоящем липсва, е по-широката наличност на набори от данни от сектора на GLAM, които са подходящи за пряко използване в контекста на научноизследователската и развойната дейност в областта на ИИ/СО. Наличието на такива набори от свободно достъпни данни би могло не само да спомогне за насърчаване на по-голяма ангажираност с цифровите данни за културното наследство в областта на ИИ/СО, но и да подпомогне прехвърлянето на неотдавнашния напредък в областта на ИИ/СО към областта на цифровото поддържане и анализа на съдържанието на културното наследство. От друга страна, по-нататъшният напредък в областта на ИИ/СО често върви ръка за ръка с публикуването на нови висококачествени набори от данни.
Поради това EuropeanaTech отправя покана за представяне на предложения за сглобяване на подходящи набори от данни за ИИ/СО въз основа на обширните колекции на уебсайта на Europeana. Търсим предложения за създаването на големи, добре документирани набори от данни, които са оформени за пряко използване за целите на ИИ/СО (като например обучение на модел) и които могат да бъдат публично достъпни на съответните онлайн платформи при отворени лицензи.
Двете печеливши предложения ще получат финансова стипендия в размер на 2500 евро в подкрепа на изготвянето, документирането и публикуването на наборите от данни. Носителите на наградата ще бъдат поканени да представят своите приноси на бъдеща (онлайн) проява на Europeana и да предоставят текст за публикуване, свързан с техните резултати.
Как да кандидатствате
За да кандидатствате, моля, прочетете насоките за подаване по-долу и представете предложение до 15 февруари 2021 г., 23:59 ч. централноевропейско време. Предложенията трябва да описват с по-малко от 1500 думи:
Предвиденото съдържание на набора от данни (по отношение на обем, видове активи, анотация и т.н.)
Процедурата, която възнамерявате да следвате за изготвяне на набора от данни
Как това е от значение за ИИ/СО.
Предложенията следва да включват и предложение за възможен случай на използване, подкрепено от предварително обучен модел с демонстрация или оценка на резултатите от него. В случай на приемане трябва да е възможно наборът от данни и цялата необходима документация и технически ресурси да бъдат изготвени и разпространени преди 30 юни 2021 г.
Колекциите на европейското културно наследство обикновено са обект на предубеждения и водят до етични въпроси. Въпреки че това може да окаже отрицателно въздействие върху ИИ и решенията за машинно самообучение, ИИ и машинното самообучение също биха могли да се използват за разкриване на тези проблеми. Тези проблеми може да не бъдат преодолени в рамките на настоящата покана, но Ви съветваме да ги документирате и обсъдите.
Наборите от данни ТРЯБВА:
да бъдат извлечени от данни, включени в различните колекции, предоставяни чрез Europeana;
Включете само метаданни, които са създадени от вас или идват от Europeana. Получените метаданни трябва да бъдат лицензирани под Creative Commons Zero;
се съставят в машинночетим формат, включително документация и място на произход;
Досега не са публикувани. Ако са публикувани преди това, стъпките трябва да бъдат подробно описани по отношение на начина, по който новият набор от данни трябва да бъде подобрен и използван;
Включете описание на един или повече случаи на предвидена употреба на набора от данни.
Наборите от данни ТРЯБВА:
Включват се само медийни активи с лиценз, съвместим със съдържанието на Europeana Publishing Framework от ниво 3;
Изясняване на връзката и приноса към най-добрите практики и най-съвременните постижения в областта на ИИ и ИП в рамките на цифровото културно наследство;
Да включи предварително обучен модел, получен в резултат на прилагането (като се използва базов метод на ИП/И за (един от) предвидените случаи на употреба) и демонстрация на използването на този модел или оценка на резултатите от него;
Документиране или обсъждане на потенциални етични въпроси и предубеждения.
Наборите от данни МОЖЕ:
Включване на допълнително кураторско обогатяване и подобрения, като например анотиране на данни, етикетиране или кръстосано съпоставяне с други (цифрови) ресурси, при условие че те са завършени преди публикуването на набора от данни и че се прилагат подходящи мерки за контрол на качеството;
Формулирайте част от публикация в рецензирано списание или конференция.
Следва да се предостави основна документация за техническите решения и всеки произведен софтуер трябва да бъде издаден под лиценз с отворен код.
Основни дати
Отваряне на поканата: 8 януари 2021 г.
Краен срок за подаване на предложения: 15 февруари 2021 г., 23:59 ч. централноевропейско време
Уведомление за приемане: 1 март 2021 г.
Публикуване на набор от данни: 30 юни 2021 г.
Критерии за възлагане
Становищата ще бъдат разгледани от работната група за ИИ на EuropeanaTech в рамките на GLAM и ръководната група на общността на EuropeanaTech въз основа на:
Значение на случая на използване за общността на GLAM: 25%
Значение на набора от данни за ИИ/СО във връзка със случая на употреба: 25%
Ясно определение на случая на използване/демонстрацията във връзка с Europeana: 30%
Яснота в описанието на набора от данни: 20%
Допустимост
Формално средствата няма да бъдат отпускани на отделни лица, а на институции, които могат да бъдат институции в областта на културното наследство или научноизследователски институции, включващи университети. Представител на всяка институция, получила наградата, ще бъде помолен да подпише договор за подизпълнение с фондация Europeana.
Кандидатите трябва да са установени в държава — членка на ЕС.
Кандидатите трябва да са членове на общността EuropeanaTech и Асоциацията на мрежата Europeana. Ако все още не сте член, можете да научите как да се присъедините.
Наградата е брутната сума, следователно включва ДДС.
Партньорите по проекта Europeana DSI-4 не отговарят на условията за финансиране. Пълният списък е достъпен тук.
Препоръчително четене
Тази страница беше редактирана на 19.1.2021 г., за да отрази удължаването на крайния срок от 31 януари 2021 г. до 15 февруари 2021 г. Той беше редактиран на 16.4.2021 г., за да отрази удължения срок, в който победителите трябва да предоставят своите набори от данни до юни 2021 г.
