Los métodos del ámbito de la inteligencia artificial (IA) y el aprendizaje automático (ML) han ayudado a superar los límites tecnológicos en diversos ámbitos, incluido el sector del patrimonio cultural (el informe provisional de EuropeanaTech AI en relación con el Grupo de Trabajo GLAM y la iniciativa AI4LAM ofrecen algunos ejemplos). Para fomentar la innovación en este ámbito, hace unas semanas EuropeanaTech anunció su primer Challenge for Europeana AI/ML Datasets. Con esta nueva actividad, queríamos estimular la creación de conjuntos de datos para el sector GLAM que puedan utilizarse para IA / ML, aprovechando los ricos recursos de patrimonio cultural disponibles en Europeana. Esperamos que la disponibilidad de tales conjuntos de datos pueda ayudar a fomentar un mayor compromiso con los datos digitales del patrimonio cultural en IA/ML y apoyar la transferencia de los recientes avances en IA/ML al campo de la curación digital y el análisis de los contenidos del patrimonio cultural.
Recibimos un total de cinco propuestas, que fueron examinadas cuidadosamente por los miembros del Grupo Director de EuropeanaTech y la IA en relación con el Grupo de Trabajo GLAM. Evaluaron las propuestas en función de su pertinencia para el sector GLAM (25 %), su pertinencia para la IA/ML (25 %), su relación con Europeana (30 %) y la claridad de la descripción y el plan de trabajo (20 %).
Anuncio de los ganadores
Entidades Nombradas en Textos Arqueológicos
Esta propuesta de un equipo con sede en la Universidad de Nápoles 'L'Orientale' tiene como objetivo crear un conjunto de datos para el Reconocimiento de Entidades Nombradas (NER) y Extracción de Términos para términos arqueológicos en italiano e inglés en la colección de Arqueología Europeana. NER es el proceso de identificar nombres propios como nombres de personas o ubicaciones en texto no estructurado. El término Extracción es similar, pero se centra en encontrar términos especializados, en este caso del dominio de la arqueología. Vocabularios como Getty y CIDOC CRM serán considerados. El conjunto de datos final podría utilizarse en el desarrollo y la evaluación de tecnologías basadas en IA/ML para NER en el ámbito de la arqueología.
Los revisores apreciaron especialmente la clara estructura y madurez de la propuesta, para la que ya se había elaborado un conjunto de datos simulados utilizando las API de Europeana para probar el enfoque propuesto. El aspecto bilingüe y la escasez de recursos abiertos similares para el campo de la arqueología también se consideraron particularmente valiosos.
Zac Grace
Esta propuesta de un estudiante de la Ecole Nationale d'Ingénieurs de Tarbes tiene como objetivo crear máscaras de píxeles para la segmentación semántica, a través de la anotación manual de datos de imagen en la colección Europeana Fashion. Esto significa que, por ejemplo, cuando se analiza una imagen, los elementos de moda relevantes (camisa, pantalón, zapatos) en la imagen se marcan con sus contornos de píxeles. Estos datos se pueden utilizar para entrenar un sistema de segmentación automatizado.

A los examinadores les gustó el alcance y la comprensión claros de la labor necesaria para aplicar la propuesta. También pensaron que tenía mucho potencial para su aplicación en diferentes colecciones.
El Corpus de Contextos Contenciosos
Esta propuesta conjunta del KNAW Humanities Cluster y el Centrum Wiskunde & Informatica en los Países Bajos quiere establecer un corpus anotado de términos contenciosos en contexto (ConConCor) de los periódicos holandeses en Europeana. Estos pueden utilizarse para arrancar y evaluar métodos (semi)automáticos para detectar tales términos en colecciones de patrimonio cultural. Los términos contenciosos aquí significan aquellas palabras o frases que sugieren algún sesgo (implícito o explícito) hacia o contra un grupo, evento o de otra manera.
Los revisores valoraron cómo esta propuesta pretende abordar un objetivo clave en el desafío, la detección de cuestiones éticas y sesgos inherentes a las colecciones de patrimonio cultural digitalizadas.
Se pondrán a disposición de los ganadores tres estipendios de 2.500 euros cada uno para implementar sus propuestas y entregar los conjuntos de datos correspondientes a finales de junio de 2021.
Descubre más
Nos gustaría expresar nuestro agradecimiento a todos los que presentaron una propuesta a este desafío por su arduo trabajo y excelentes ideas. ¡Esperamos con interés la implementación de los proyectos ganadores y esperamos que se abra otra ronda en el futuro para aquellos que no tuvieron éxito esta vez!
Si desea conocer más oportunidades como esta y establecer contactos y colaborar con profesionales técnicos multidisciplinarios de todo el mundo, únase a EuropeanaTech a través de la Europeana Network Association y siga a la comunidad en Twitter.
Esta publicación fue editada el 16/04/21 para reflejar el plazo extendido para que los ganadores entreguen sus conjuntos de datos.
