Методите от областта на изкуствения интелект (ИИ) и машинното самообучение (ML) спомогнаха за преодоляване на технологичните граници в различни области, включително в сектора на културното наследство (междинният доклад на EuropeanaTech AI във връзка с работната група за GLAM и инициативата AI4LAM дават някои примери). За да насърчи иновациите в тази област, преди няколко седмици EuropeanaTech обяви първото си предизвикателство за набори от данни за ИИ/СО на Europeana. С тази нова дейност искахме да стимулираме създаването на набори от данни за сектора на GLAM, които могат да се използват за ИИ/СО, като се използват богатите ресурси на културното наследство, налични в Europeana. Надяваме се, че наличието на такива набори от данни би могло да спомогне за насърчаване на по-голяма ангажираност с цифровите данни за културното наследство в областта на ИИ/СО и да подкрепи прехвърлянето на неотдавнашния напредък в областта на ИИ/СО в областта на цифровото поддържане и анализа на съдържанието на културното наследство.
Получихме общо пет предложения, които бяха внимателно разгледани от членовете на ръководната група за EuropeanaTech и ИИ във връзка с работната група за GLAM. Те оцениха предложенията въз основа на тяхното значение за сектора на GLAM (25 %), значение за ИИ/СО (25 %), връзка с Europeana (30 %) и яснота на описанието и работния план (20 %).
Обявяване на победителите
Имена на лица в археологически текстове
Това предложение от екип, базиран в Университета на Неапол "L'Orientale", има за цел да създаде набор от данни за разпознаване на имена на образувания (NER) и извличане на термина за археологически термини на италиански и английски език в колекцията Europeana Archeology. NER е процесът на идентифициране на собствени имена като имена на лица или местоположения в неструктуриран текст. Терминът Извличане е подобен, но се фокусира върху намирането на специализирани термини, в този случай от областта на археологията. Ще бъдат разгледани речници като Getty и CIDOC CRM. Окончателният набор от данни би могъл да се използва при разработването и оценката на основани на ИИ/СО технологии за NER в областта на археологията.
Рецензентите оцениха по-специално ясната структура и зрелостта на предложението, за което вече беше изготвен макетен набор от данни с помощта на API на Europeana за тестване на предложения подход. Двуезичният аспект и недостигът на подобни отворени ресурси за археологическото поле също се разглеждат като особено ценни.
Зак Грейс
Това предложение на студент от Ecole Nationale d'Ingénieurs de Tarbes има за цел да създаде пикселни маски за семантично сегментиране чрез ръчно анотиране на данните за изображенията в колекцията Europeana Fashion. Това означава, че например, когато се анализира изображение, съответните модни елементи (риза, панталон, обувки) в изображението след това се маркират с техните пикселни очертания. Тези данни могат да се използват за обучение на автоматизирана система за сегментиране.

Рецензентите харесаха ясния обхват и разбиране на работата, необходима за изпълнението на предложението. Те също така смятат, че има голям потенциал за приложение в различни колекции.
Спорният контекст Corpus
Това съвместно предложение на KNAW Humanities Cluster и Centrum Wiskunde & Informatica в Холандия иска да създаде анотиран корпус от спорни термини в контекста (ConConCor) от нидерландските вестници в Europeana. След това те могат да се използват за проследяване и оценка на (полу)автоматични методи за откриване на такива термини в сбирките на културното наследство. Спорните термини тук означават тези думи или фрази, които предполагат някаква (имплицитна или изрична) пристрастност към или срещу група, събитие или по друг начин.
Рецензентите оцениха начина, по който настоящото предложение има за цел да се справи с ключова цел, свързана с предизвикателството, откриването на етични въпроси и предубеждения, които са присъщи на цифровизираните сбирки на културното наследство.
На победителите ще бъдат предоставени три стипендии по 2500 евро всяка, за да изпълнят своите предложения и да предоставят съответните набори от данни до края на юни 2021 г.
Научете повече
Бихме искали да благодарим на всички, които внесоха предложение за това предизвикателство за тяхната упорита работа и отлични идеи. Очакваме с нетърпение изпълнението на печелившите проекти и се надяваме, че в бъдеще ще се открие още един кръг за тези, които не са успели този път!
Ако искате да научите повече за подобни възможности и да си сътрудничите с мултидисциплинарни технически специалисти от цял свят, присъединете се към EuropeanaTech чрез асоциацията Europeana Network и следете общността в Twitter.
Тази публикация беше редактирана на 16.4.2021 г., за да отрази удължения срок, в който победителите трябва да предоставят своите набори от данни.
