Marco Rendina: Eirini, empecemos por lo básico. ¿Qué es el crowdsourcing?
Eirini Kaldeli: Crowdsourcing es el proceso de distribución de una tarea a un grupo de personas, que suelen contribuir a través de su trabajo en línea. En algunos casos, los contribuyentes reciben una indemnización material; en otros, su participación es voluntaria, y las recompensas son inmateriales, como la satisfacción personal, la contribución cultural o la adquisición de conocimientos. Dentro del sector del patrimonio cultural, el crowdsourcing se ha utilizado durante mucho tiempo para abordar diversos desafíos, desde la recopilación y transcripción de contenidos hasta el etiquetado de colecciones y la detección de términos sesgados en la descripción de los objetos del patrimonio cultural. Dependiendo de la naturaleza de la tarea, los participantes pueden necesitar habilidades o conocimientos especializados.
RM: ¿Cuáles son los beneficios del crowdsourcing para el sector del patrimonio cultural?
EK: Un proyecto de crowdsourcing responsable y significativo puede aportar beneficios mutuos a las instituciones y participantes en el patrimonio cultural. En primer lugar, el crowdsourcing debe abordarse como un medio para involucrar a los ciudadanos con las colecciones del patrimonio. Por un lado, los participantes tienen la oportunidad de interactuar con el patrimonio cultural y conectarse con él; aprender información útil sobre ítems y temas de una manera lúdica; compartir sus perspectivas y conocimientos; dar forma conjunta a la forma en que se presentan las colecciones; y colaborar con los conciudadanos en una experiencia participativa. Por otra parte, las instituciones de patrimonio cultural pueden mejorar la calidad de sus colecciones y hacerlas más detectables y accesibles; sensibilizar sobre sus bienes patrimoniales culturales; llegar a nuevos públicos; y obtener una visión más profunda de cómo sus colecciones son percibidas por las comunidades.
RM: Spyros, ¿podría decirnos algunas palabras sobre la plataforma CrowdHeritage en la que está trabajando en el contexto del proyecto AI4Culture?
Spyros Bekiaris: CrowdHeritage es una plataforma abierta para organizar campañas de crowdsourcing en línea que movilizan a las personas para mejorar la calidad de las colecciones de patrimonio cultural. Esto podría estar relacionado con diferentes aspectos, desde la cobertura multilingüe hasta el etiquetado semántico. Se invita a los participantes a enriquecer las colecciones digitales, ya sea produciendo nueva información (por ejemplo, añadiendo geolocalizaciones) o evaluando y validando los resultados automáticos producidos por herramientas digitales (por ejemplo, traducciones automáticas o detección de lenguaje sesgado).
CrowdHeritage se ha utilizado ampliamente para estimular la participación en entornos educativos y entornos de ciencia ciudadana al involucrar a las comunidades, incluidos estudiantes y alumnos, amantes de la cultura, profesionales del patrimonio cultural y el público en general. La plataforma se ha utilizado hasta ahora para organizar 40 campañas de crowdsourcing con más de 970 colaboradores únicos, generando alrededor de 112.000 anotaciones y evaluando más de 16.000.
RM: El crowdsourcing se basa en el esfuerzo manual distribuido, mientras que AI4Culture se trata de tecnologías de IA. ¿Puede explicar la relación entre la plataforma CrowdHeritage y las herramientas de IA?
SB: CrowdHeritage fue diseñado originalmente para admitir campañas que invitan a los usuarios a agregar nuevas anotaciones desde cero. En los últimos años, estamos viendo un creciente interés en acoplar CrowdHeritage con herramientas de IA. Estas herramientas ofrecen oportunidades notables para mejorar automáticamente la calidad de las colecciones digitales del patrimonio cultural a escala y con el mínimo esfuerzo manual, desde el reconocimiento óptico de caracteres y la traducción automática hasta el subtitulado automático y la clasificación de imágenes.
Sin embargo, recurrir a métodos puramente automáticos también ha revelado varias cuestiones que deben abordarse. Necesitamos formas de evaluar si los resultados de los algoritmos de IA son lo suficientemente precisos para nuestros estándares y comparar cómo se comportan los diferentes algoritmos en datos específicos y en función de ciertos criterios. En este contexto, el crowdsourcing es un excelente medio para aprovechar la inteligencia humana colectiva y recopilar información útil. La retroalimentación acumulada puede ayudarnos a filtrar resultados automáticos incorrectos, aplicar filtros apropiados para mantener lo que consideramos resultados de buena calidad y detectar ciertas deficiencias de los algoritmos de IA. En esta interacción con la IA, la plataforma CrowdHeritage también es útil para producir conjuntos de datos de la verdad sobre el terreno que pueden explotarse aún más para adaptar las herramientas de IA en relación con los datos del patrimonio cultural.
RM: Eirini, ¿puedes proporcionar algunos ejemplos concretos de cómo se ha aplicado CrowdHeritage en combinación con herramientas de IA?
EK: ¡Puedo proporcionar muchos! En el contexto del proyecto Europeana Translate, realizamos una serie de campañas en las que los participantes evaluaron los resultados de un algoritmo de traducción automática entrenado en los metadatos de Europeana (desarrollado por nuestro socio de AI4Culture, Pangeanic). Esta información nos permitió mejorar la calidad de los resultados y también dio lugar a la creación de conjuntos de datos abiertos publicados en el repositorio ELRC-SHARE, que reúne recursos lingüísticos en toda la UE.
En otro estudio de caso sobre la selección de modelos óptimos de Super Resolución (SR) para diferentes tipos de imágenes (que conoces muy bien, Marco!), organizamos una campaña en colaboración con la Asociación Europea del Patrimonio de la Moda (EFHA), donde se pidió a los participantes que compararan y clasificaran una muestra de imágenes mejoradas por diferentes modelos SR. Los resultados de esta campaña permitieron a EFHA seleccionar y aplicar el mejor algoritmo SR en función de las características de la imagen.
En el marco del proyecto CRAFTED, se organizaron una serie de campañas para evaluar los colores identificados automáticamente por algoritmos de detección de color de IA. El análisis de la retroalimentación recopilada nos llevó a la conclusión de que los algoritmos automáticos identificaron repetidamente algunos colores ausentes específicos y perdieron algunos existentes, algo que nos ayudó a mejorar nuestro enfoque de filtrado y seleccionar la mejor configuración de algoritmo.
En el proyecto DE-BIAS, estamos en el proceso de establecer una serie de campañas en las que las comunidades inspeccionarán y evaluarán los términos marcados por una herramienta de detección automática de sesgos que contengan un lenguaje despectivo.
RM: Eso es realmente interesante, Eirini, pero ¿podrán las instituciones de patrimonio cultural utilizar la plataforma CrowdHeritage para crear sus propias campañas de crowdsourcing?
EK: ¡Por supuesto! A través del proyecto AI4Culture, se ha puesto a disposición en CrowdHeritage una nueva función de «editor de campañas», que permite a cualquiera configurar y ejecutar una campaña de crowdsourcing en la plataforma. ¡Cualquier persona interesada puede ver este video tutorial o consultar la documentación de CrowdHeritage para obtener más información!
Descubre más
En septiembre de 2024, el proyecto pondrá en marcha una plataforma en la que se pondrá a disposición en línea un conjunto de herramientas abiertas, junto con la documentación y los materiales de formación conexos. ¡Manténgase atento a la página del proyecto en Europeana Pro para obtener más detalles y esté atento a la cuenta del proyecto LinkedIn y X!
