Marco Rendina: Eirini, zacznijmy od podstaw. Czym jest crowdsourcing?
Eirini Kaldeli: Crowdsourcing to proces dystrybucji zadania do grupy osób, które zazwyczaj przyczyniają się poprzez swoją pracę online. W niektórych przypadkach podmioty przekazujące dane otrzymują rekompensatę materialną; w innych przypadkach ich uczestnictwo jest dobrowolne, a nagrody są nieistotne, takie jak osobiste zadowolenie, wkład kulturalny lub zdobywanie wiedzy. W sektorze dziedzictwa kulturowego crowdsourcing od dawna wykorzystuje się w celu sprostania różnym wyzwaniom, od gromadzenia i transkrypcji treści po znakowanie zbiorów i wykrywanie stronniczych terminów w opisie obiektów dziedzictwa kulturowego. W zależności od charakteru zadania uczestnicy mogą potrzebować specjalistycznych umiejętności lub wiedzy.
MR: Jakie są korzyści crowdsourcingu dla sektora dziedzictwa kulturowego?
EK: Odpowiedzialny i znaczący projekt crowdsourcingowy może przynieść wzajemne korzyści instytucjom dziedzictwa kulturowego i uczestnikom. Przede wszystkim należy potraktować crowdsourcing jako sposób na zaangażowanie obywateli w kolekcje dziedzictwa. Z jednej strony uczestnicy mają możliwość interakcji z dziedzictwem kulturowym i nawiązania z nim kontaktu; uczyć się przydatnych informacji o przedmiotach i tematach w zabawny sposób; dzielić się swoimi spostrzeżeniami i wiedzą; współkształtowanie sposobu prezentacji zbiorów; i współpracować z innymi obywatelami w ramach doświadczeń partycypacyjnych. Z drugiej strony instytucje dziedzictwa kulturowego mogą poprawić jakość swoich zbiorów oraz uczynić je bardziej dostępnymi i dostępnymi. podnoszenie świadomości na temat ich zasobów dziedzictwa kulturowego; dotarcie do nowych odbiorców; i uzyskać głębszy wgląd w to, jak ich kolekcje są postrzegane przez społeczności.
MR: Spyros, czy mógłbyś powiedzieć nam kilka słów o platformie CrowdHeritage, nad którą pracujesz w kontekście projektu AI4Culture?
Spyros Bekiaris: CrowdHeritage to otwarta platforma do organizowania internetowych kampanii crowdsourcingowych, które mobilizują ludzi do poprawy jakości kolekcji dziedzictwa kulturowego. Może to dotyczyć różnych aspektów, od zasięgu wielojęzycznego po znakowanie semantyczne. Uczestnicy są proszeni o wzbogacenie zbiorów cyfrowych poprzez tworzenie nowych informacji (np. dodanie geolokalizacji) lub poprzez ocenę i walidację automatycznych wyników generowanych przez narzędzia cyfrowe (np. automatyczne tłumaczenia lub wykrywanie stronniczego języka).
CrowdHeritage jest szeroko wykorzystywane do stymulowania uczestnictwa w środowiskach edukacyjnych i środowiskach nauki obywatelskiej poprzez angażowanie społeczności, w tym studentów i uczniów, miłośników kultury, osób zawodowo zajmujących się dziedzictwem kulturowym i ogółu społeczeństwa. Platforma została dotychczas wykorzystana do zorganizowania 40 kampanii crowdsourcingowych z ponad 970 unikalnymi współpracownikami, generując około 112 000 adnotacji i oceniając ponad 16 000.
MR: Crowdsourcing jest zakorzeniony w rozproszonym wysiłku ręcznym, podczas gdy AI4Culture dotyczy technologii AI. Czy możesz wyjaśnić związek między platformą CrowdHeritage a narzędziami AI?
SB: CrowdHeritage został pierwotnie zaprojektowany w celu wspierania kampanii, które zachęcają użytkowników do dodawania nowych adnotacji od podstaw. W ciągu ostatnich kilku lat obserwujemy rosnące zainteresowanie łączeniem CrowdHeritage z narzędziami AI. Narzędzia te oferują niezwykłe możliwości automatycznej poprawy jakości cyfrowych zbiorów dziedzictwa kulturowego na dużą skalę i przy minimalnym wysiłku fizycznym, od optycznego rozpoznawania znaków i tłumaczenia maszynowego po automatyczne napisy i klasyfikację obrazów.
Jednak odwoływanie się do metod czysto automatycznych ujawniło również kilka kwestii, którymi należy się zająć. Potrzebujemy sposobów oceny, czy wyniki algorytmów sztucznej inteligencji są wystarczająco dokładne dla naszych standardów, oraz porównania, w jaki sposób różne algorytmy zachowują się na konkretnych danych i w oparciu o określone kryteria. W tym kontekście crowdsourcing jest doskonałym sposobem na wykorzystanie zbiorowej ludzkiej inteligencji i zebranie przydatnych spostrzeżeń. Zgromadzone informacje zwrotne mogą pomóc nam odfiltrować nieprawidłowe automatyczne wyniki, zastosować odpowiednie filtry do utrzymania tego, co uważamy za wyniki dobrej jakości, i wykryć pewne niedociągnięcia algorytmów sztucznej inteligencji. W tej interakcji ze sztuczną inteligencją platforma CrowdHeritage jest również pomocna w tworzeniu zbiorów danych opartych na prawdzie gruntowej, które można dalej wykorzystywać do dostosowywania narzędzi sztucznej inteligencji w odniesieniu do danych dotyczących dziedzictwa kulturowego.
MR: Eirini, czy możesz podać konkretne przykłady zastosowania CrowdHeritage w połączeniu z narzędziami AI?
EK: Mogę zapewnić wiele! W ramach projektu Europeana Translate przeprowadziliśmy szereg kampanii, w których uczestnicy ocenili wyniki algorytmu tłumaczenia maszynowego przeszkolonego na podstawie metadanych Europeany (opracowanego przez naszego partnera AI4Culture Pangeanic). Te informacje zwrotne pozwoliły nam poprawić jakość wyników, a także doprowadziły do utworzenia otwartych zbiorów danych publikowanych w repozytorium ELRC-SHARE, które gromadzi zasoby językowe w całej UE.
W innym studium przypadku dotyczącym wyboru optymalnych modeli Super Resolution (SR) dla różnych typów obrazów (które bardzo dobrze znasz, Marco!), we współpracy z Europejskim Stowarzyszeniem Dziedzictwa Mody (EFHA) uruchomiliśmy kampanię, w której uczestnicy zostali poproszeni o porównanie i uszeregowanie próbki obrazów przeskalowanych przez różne modele SR. Wyniki tej kampanii umożliwiły EFHA wybór i zastosowanie najlepszego algorytmu SR w zależności od charakterystyki obrazu.
W ramach projektu CRAFTED zorganizowano serię kampanii mających na celu ocenę kolorów automatycznie identyfikowanych przez algorytmy wykrywania kolorów AI. Analiza zebranych informacji zwrotnych doprowadziła nas do wniosku, że automatyczne algorytmy wielokrotnie identyfikowały pewne konkretne nieobecne kolory i pomijały niektóre istniejące, co pomogło nam ulepszyć nasze podejście do filtrowania i wybrać najlepszą konfigurację algorytmu.
W ramach projektu DE-BIAS jesteśmy w trakcie tworzenia serii kampanii, w ramach których społeczności będą sprawdzać i oceniać terminy oznaczone za pomocą automatycznego narzędzia do wykrywania stronniczości jako zawierające obraźliwy język.
MR: To naprawdę interesujące, Eirini, ale czy instytucje dziedzictwa kulturowego będą mogły korzystać z platformy CrowdHeritage do organizowania własnych kampanii crowdsourcingowych?
EK: Oczywiście! W ramach projektu AI4Culture udostępniono nową funkcję „edytora kampanii” w serwisie CrowdHeritage, która umożliwia każdemu zorganizowanie i przeprowadzenie kampanii crowdsourcingowej na platformie. Każdy zainteresowany może zapoznać się z tym samouczkiem wideo lub zapoznać się z dokumentacją CrowdHeritage, aby dowiedzieć się więcej!
Dowiedz się więcej
We wrześniu 2024 r. w ramach projektu uruchomiona zostanie platforma, na której dostępny będzie zestaw otwartych narzędzi online wraz z odpowiednią dokumentacją i materiałami szkoleniowymi. Obserwuj stronę projektu na Europeana Pro, aby uzyskać więcej informacji i bądź na bieżąco z projektem LinkedIn i kontem X!
