Marco Rendina: Eirini, vamos começar pelo básico. O que é o crowdsourcing?
Eirini Kaldeli: Crowdsourcing é o processo de distribuição de uma tarefa a um grupo de pessoas, que normalmente contribuem através do seu trabalho online. Em alguns casos, os contribuintes recebem uma compensação material; noutros, a sua participação é voluntária, sendo as recompensas imateriais, como a satisfação pessoal, a contribuição cultural ou a aquisição de conhecimentos. No setor do património cultural, o crowdsourcing tem sido utilizado há muito tempo para dar resposta a vários desafios, desde a recolha e transcrição de conteúdos até à marcação de coleções e à deteção de termos tendenciosos na descrição de bens do património cultural. Dependendo da natureza da tarefa, os participantes podem necessitar de competências ou conhecimentos especializados.
MR: Quais são os benefícios do crowdsourcing para o setor do património cultural?
EK: Um projeto de crowdsourcing responsável e significativo pode trazer benefícios mútuos às instituições responsáveis pelo património cultural e aos participantes. Em primeiro lugar, o crowdsourcing deve ser abordado como um meio de envolver os cidadãos nas coleções de património. Por um lado, os participantes têm a oportunidade de interagir com o património cultural e de estabelecer ligações com o mesmo; aprender informações úteis sobre itens e tópicos de uma forma lúdica; partilhar as suas perspetivas e conhecimentos; co-formar a forma como as colecções são apresentadas; e colaborar com os concidadãos numa experiência participativa. Por outro lado, as instituições responsáveis pelo património cultural podem melhorar a qualidade das suas coleções e torná-las mais visíveis e acessíveis; Sensibilizar para os seus bens do património cultural; chegar a novos públicos; e obter informações mais profundas sobre a forma como as suas coleções são percebidas pelas comunidades.
MR: Spyros, pode dizer-nos algumas palavras sobre a plataforma CrowdHeritage em que está a trabalhar no contexto do projeto AI4Culture?
Spyros Bekiaris: O CrowdHeritage é uma plataforma aberta para a organização de campanhas de crowdsourcing em linha que mobilizam as pessoas para melhorar a qualidade das coleções do património cultural. Tal pode dizer respeito a diferentes aspetos, desde a cobertura multilingue até à etiquetagem semântica. Os participantes são convidados a enriquecer as coleções digitais, quer produzindo novas informações (por exemplo, acrescentando geolocalizações), quer avaliando e validando os resultados automáticos produzidos por ferramentas digitais (por exemplo, traduções automáticas ou deteção de linguagem tendenciosa).
O CrowdHeritage tem sido amplamente utilizado para estimular a participação em ambientes educativos e ambientes de ciência cidadã, envolvendo comunidades, incluindo estudantes e alunos, amantes da cultura, profissionais do património cultural e o público em geral. Até à data, a plataforma foi utilizada para organizar 40 campanhas de crowdsourcing com mais de 970 contribuidores únicos, gerando cerca de 112 000 anotações e avaliando mais de 16 000.
MR: O crowdsourcing está enraizado no esforço manual distribuído, enquanto o AI4Culture trata de tecnologias de IA. Pode explicar a relação entre a plataforma CrowdHeritage e as ferramentas de IA?
SB: O CrowdHeritage foi originalmente concebido para apoiar campanhas que convidam os utilizadores a adicionar novas anotações a partir do zero. Nos últimos anos, assistimos a um interesse crescente em associar o CrowdHeritage a ferramentas de IA. Estas ferramentas oferecem oportunidades notáveis para melhorar automaticamente a qualidade das coleções digitais do património cultural em grande escala e com um esforço manual mínimo, desde o reconhecimento ótico de carateres e a tradução automática até à legendagem automática e à classificação de imagens.
No entanto, o recurso a métodos puramente automáticos também revelou várias questões que têm de ser tratadas. Precisamos de formas de avaliar se os resultados dos algoritmos de IA são suficientemente exatos para as nossas normas e de comparar o comportamento dos diferentes algoritmos com base em dados específicos e em determinados critérios. Neste contexto, o crowdsourcing é um excelente meio para aproveitar a inteligência humana coletiva e recolher informações úteis. O feedback acumulado pode ajudar-nos a filtrar resultados automáticos incorretos, aplicar filtros adequados para manter o que consideramos resultados de boa qualidade e detetar certas deficiências dos algoritmos de IA. Nesta interação com a IA, a plataforma CrowdHeritage também é útil para a produção de conjuntos de dados de verdade no terreno que podem ser mais explorados para adaptar as ferramentas de IA em relação aos dados do património cultural.
MR: Eirini, pode fornecer alguns exemplos concretos de como o CrowdHeritage foi aplicado em combinação com ferramentas de IA?
EK: Posso fornecer muitos! No contexto do projeto Europeana Tradutor, o Tribunal realizou uma série de campanhas em que os participantes avaliaram os resultados de um algoritmo de tradução automática formado em metadados Europeana (desenvolvido pelo nosso parceiro AI4Culture Pangeanic). Estas reações permitiram-nos melhorar a qualidade dos resultados e também conduziram à criação de conjuntos de dados abertos publicados no repositório ELRC-SHARE, que reúne recursos linguísticos em toda a UE.
Num outro estudo de caso sobre a seleção de modelos de Super Resolução (SR) ideais para diferentes tipos de imagens (que conhece muito bem, Marco!), criámos uma campanha em colaboração com a Associação Europeia do Património da Moda (EFHA), onde foi pedido aos participantes que comparassem e classificassem uma amostra de imagens melhoradas por diferentes modelos de SR. Os resultados desta campanha permitiram à EFHA selecionar e aplicar o melhor algoritmo SR em função das características da imagem.
No âmbito do projeto CRAFTED, foi organizada uma série de campanhas para avaliar as cores automaticamente identificadas por algoritmos de deteção de cores de IA. A análise dos comentários recolhidos levou-nos à conclusão de que os algoritmos automáticos identificaram repetidamente algumas cores ausentes específicas e perderam algumas cores existentes, algo que nos ajudou a melhorar a nossa abordagem de filtragem e selecionar a melhor configuração de algoritmo.
No projeto DE-BIAS, estamos em processo de criação de uma série de campanhas em que as comunidades inspecionam e avaliam termos assinalados por uma ferramenta automática de deteção de preconceitos como contendo linguagem depreciativa.
MR: Isso é realmente interessante, Eirini, mas será que as instituições responsáveis pelo património cultural poderão utilizar a plataforma CrowdHeritage para criar as suas próprias campanhas de crowdsourcing?
EK: Claro! Através do projeto AI4Culture, foi disponibilizada uma nova funcionalidade de «editor de campanhas» no CrowdHeritage, que permite a qualquer pessoa criar e executar uma campanha de crowdsourcing na plataforma. Qualquer pessoa interessada pode ver este tutorial em vídeo ou conferir a documentação do CrowdHeritage para saber mais!
Mais informações
Em setembro de 2024, o projeto lançará uma plataforma onde será disponibilizado em linha um conjunto de ferramentas abertas, juntamente com documentação e materiais de formação conexos. Fique de olho na página do projeto no Europeana Pro para obter mais detalhes e fique ligado na conta do projeto LinkedIn e X!
