Марко Рендина: Eirini, нека започнем от основите. Какво е краудсорсинг?
Ейрини Калдели: Crowdsourcing е процес на разпределяне на задача на група хора, които обикновено допринасят чрез работата си онлайн. В някои случаи вносителите получават материално обезщетение; в други участието им е доброволно, като възнагражденията са несъществени, като например лично удовлетворение, културен принос или придобиване на знания. В сектора на културното наследство краудсорсингът отдавна се използва за справяне с различни предизвикателства — от събирането и транскрипцията на съдържание до маркирането на колекции и откриването на пристрастни термини в описанието на обекти на културното наследство. В зависимост от естеството на задачата участниците може да се нуждаят от специализирани умения или знания.
МР: Какви са ползите от краудсорсинг за сектора на културното наследство?
ЕК: Един отговорен и съдържателен проект за краудсорсинг може да донесе взаимни ползи за институциите и участниците в областта на културното наследство. На първо място, към краудсорсинг следва да се подхожда като към средство за ангажиране на гражданите с колекциите от наследство. От една страна, участниците имат възможност да взаимодействат с културното наследство и да се свързват с него; да научат полезна информация за предмети и теми по забавен начин; да споделят своите гледни точки и знания; съвместно оформяне на начина на представяне на колекциите; и да си сътрудничат със съгражданите си в опит, основан на участието. От друга страна, институциите за културно наследство могат да подобрят качеството на своите колекции и да ги направят по-лесно откриваеми и достъпни; да повишават осведомеността относно своите активи в областта на културното наследство; достигане до нови аудитории; и да получат по-задълбочена представа за начина, по който техните колекции се възприемат от общностите.
МР: Спирос, можеш ли да ни кажеш няколко думи за платформата CrowdHeritage, върху която работиш в контекста на проекта AI4Culture?
Спирос Бекиарис: CrowdHeritage е отворена платформа за организиране на онлайн краудсорсинг кампании, които мобилизират хората да подобрят качеството на колекциите от културно наследство. Това може да бъде свързано с различни аспекти — от многоезично покритие до семантично маркиране. Участниците се приканват да обогатят цифровите колекции или чрез изготвяне на нова информация (напр. добавяне на географски местоположения), или чрез оценка и валидиране на автоматичните резултати, генерирани от цифрови инструменти (напр. автоматичен превод или откриване на пристрастен език).
CrowdHeritage се използва широко за стимулиране на участието в образователната среда и гражданската наука чрез ангажиране на общности, включително студенти и ученици, любители на културата, професионалисти в областта на културното наследство и широката общественост. Досега платформата е била използвана за организиране на 40 краудсорсинг кампании с повече от 970 уникални сътрудници, генерирайки около 112 000 анотации и оценявайки повече от 16 000.
МР: Crowdsourcing се основава на разпределени ръчни усилия, докато AI4Culture е за AI технологии. Можете ли да обясните връзката между платформата CrowdHeritage и инструментите на ИИ?
SB: CrowdHeritage първоначално е създаден, за да поддържа кампании, които приканват потребителите да добавят нови анотации от нулата. През последните няколко години наблюдаваме нарастващ интерес към свързването на CrowdHeritage с инструменти на ИИ. Тези инструменти предлагат забележителни възможности за автоматично подобряване на качеството на цифровите колекции на културното наследство в голям мащаб и с минимални ръчни усилия — от оптично разпознаване на символи и машинен превод до автоматично субтитриране и класификация на изображенията.
Прибягването до чисто автоматични методи обаче разкри и няколко въпроса, които трябва да бъдат разгледани. Нуждаем се от начини да преценим дали резултатите от алгоритмите на ИИ са достатъчно точни за нашите стандарти и да сравним поведението на различните алгоритми въз основа на конкретни данни и въз основа на определени критерии. В този контекст краудсорсингът е отлично средство за използване на колективната човешка интелигентност и събиране на полезна информация. Натрупаната обратна връзка може да ни помогне да филтрираме неправилните автоматични резултати, да прилагаме подходящи филтри за поддържане на това, което считаме за качествени резултати, и да забелязваме някои недостатъци на алгоритмите на ИИ. В това взаимодействие с ИИ платформата CrowdHeritage е полезна и за изготвянето на набори от данни за наземната истина, които могат да бъдат допълнително използвани за адаптиране на инструментите с ИИ във връзка с данните за културното наследство.
МР: Eirini, можете ли да дадете някои конкретни примери за това как CrowdHeritage се прилага в комбинация с инструменти на ИИ?
ЕК: Мога да осигуря много! В контекста на проекта Europeana Translate проведохме редица кампании, в които участниците оцениха резултатите от алгоритъм за машинен превод, обучен на базата на метаданни на Europeana (разработен от нашия партньор в AI4Culture Pangeanic). Тази обратна информация ни позволи да подобрим качеството на резултатите и също така доведе до създаването на набори от отворени данни, публикувани в хранилището ELRC-SHARE, което събира езикови ресурси в целия ЕС.
В друг казус за избор на оптимални модели Super Resolution (SR) за различни типове изображения (който познавате много добре, Марко!), ние създадохме кампания в сътрудничество с Европейската асоциация за модно наследство (EFHA), където участниците бяха помолени да сравнят и класират извадка от изображения с по-голям мащаб от различни модели SR. Резултатите от тази кампания позволиха на EFHA да избере и приложи най-добрия алгоритъм за SR в зависимост от характеристиките на изображението.
В рамките на проекта CRAFTED бяха организирани поредица от кампании за оценка на цветовете, автоматично идентифицирани чрез алгоритми за откриване на цветове с ИИ. Анализът на събраната обратна връзка ни доведе до заключението, че автоматичните алгоритми многократно са идентифицирали някои специфични отсъстващи цветове и са пропуснали някои съществуващи, което ни помогна да подобрим подхода си за филтриране и да изберем най-добрата настройка на алгоритъма.
В рамките на проекта DE-BIAS сме в процес на създаване на поредица от кампании, в рамките на които общностите ще проверяват и оценяват термините, обозначени от инструмент за автоматично откриване на предубеждения като съдържащи пренебрежителен език.
МР: Това е наистина интересно, Ейрини, но ще могат ли институциите за културно наследство да използват платформата CrowdHeritage, за да организират свои собствени краудсорсинг кампании?
ЕК: Разбира се! Чрез проекта AI4Culture в CrowdHeritage беше предоставена нова функция за „редактор на кампании“, която позволява на всеки да създаде и проведе кампания за краудсорсинг на платформата. Всеки, който се интересува, може да разгледа този видеоурок или да провери документацията на CrowdHeritage, за да научи повече!
Научете повече
През септември 2024 г. проектът ще стартира платформа, на която онлайн ще бъде предоставен набор от отворени инструменти, заедно със съответната документация и материали за обучение. Следете страницата на проекта в Europeana Pro за повече подробности и следете профила на проекта LinkedIn и X!
