Agregación de datos vinculados
Los datos enlazados son una forma de publicar datos estructurados en la web que permite conectar y enriquecer los metadatos. Esto garantiza que se puedan encontrar diferentes representaciones del mismo contenido y enlaces entre recursos relacionados. La agregación de datos vinculados tiene el potencial de aportar beneficios en términos de costes y mejorar la interoperabilidad de los datos a escala mundial, y el proyecto Europeana Common Culture investigó la viabilidad de utilizar dichos datos vinculados para la agregación.
Europeana ya cuenta con un modelo de agregación de metadatos escalable y sostenible para el sector del patrimonio cultural. La agregación de datos vinculados significaría que los proveedores de datos podrían compartir más fácilmente sus metadatos con agregadores del patrimonio cultural que hicieran uso de datos vinculados. Para los proveedores que aún no publiquen datos vinculados, su aplicación para participar en Europeana también les proporcionaría la ventaja de poder utilizar sus datos vinculados para otras aplicaciones y con otros ámbitos además del patrimonio cultural, como los motores de búsqueda en Internet.
Trabajar con proveedores de datos
Este piloto se ejecutó desde mayo de 2019 hasta junio de 2020. Fue coordinado por el Instituto Holandés para el Sonido y la Visión (NISV) y entregado en estrecha colaboración con la Red Holandesa de Patrimonio Digital (NDE) que apoyó el proyecto proporcionando conocimiento, software e infraestructura para ejecutar las pruebas. En el proyecto piloto participaron tres tipos de participantes en el ecosistema de Europeana: proveedores de datos, agregadores y la Fundación Europeana. Doce proveedores de datos se unieron al piloto, pero no todos eran plenamente conscientes de los desafíos técnicos que este nuevo enfoque traería. Cuatro de los proveedores no pudieron entregar un conjunto de datos como datos vinculados, y otros dos proveedores entregaron conjuntos de datos con datos insuficientes para su agregación en Europeana.
En los seis casos exitosos, cinco proveedores ya tenían conocimientos internos o una implementación existente de datos vinculados, y por un lado, fue su primer esfuerzo para publicar datos vinculados. Nuestra conclusión es que hay mucho interés en implementar datos vinculados entre los proveedores de datos. Sin embargo, requiere un nivel significativo de recursos cuando una organización no tiene experiencia previa.
Resultados piloto
El proyecto piloto aplicó un enfoque para la agregación de datos vinculados basado en dos especificaciones para la entrega de un conjunto de datos vinculados para Europeana. Anteriormente habían tenido éxito para un proyecto piloto a pequeña escala en el marco del proyecto Rise of Literacy.
La primera especificación es que los metadatos a nivel de conjunto de datos deben proporcionarse utilizando vocabularios bien conocidos. Incluye los tipos de distribuciones de conjuntos de datos que los proveedores de datos pueden usar y los metadatos requeridos para cada uno.
Una segunda especificación aborda el uso de datos vinculados a Schema.org para describir objetos del patrimonio cultural de acuerdo con los requisitos de Europeana y el Modelo de Datos de Europeana (EDM). Actualmente, Europeana solo admite la ingestión de metadatos en EDM. Sin embargo, los experimentos sobre la aplicación de Schema.org a las descripciones de metadatos de objetos del patrimonio cultural han demostrado que puede proporcionar datos de buena calidad, que es capaz de cumplir los requisitos de Europeana. Esta especificación proporciona un nivel general de orientación para el uso de metadatos de Schema.org que, después de la conversión a EDM, dará lugar a metadatos que son adecuados para la agregación por Europeana.
Este proyecto piloto también dio lugar a un conjunto de herramientas para la agregación de datos vinculados diseñado para su uso por los agregadores y agregadores de Europeana de otras redes similares. Aunque la funcionalidad del conjunto de herramientas está diseñada para el EDM, los agregadores que utilizan otros modelos de datos pueden agregar sus propias conversiones y validaciones utilizando los estándares implementados por el conjunto de herramientas. El conjunto de herramientas se basa en contenedores Docker que preservan la independencia técnica de sus herramientas, haciendo que la solución sea portátil a diferentes entornos y escalable, dando la posibilidad de aplicar el conjunto de herramientas a colecciones pequeñas o grandes. El conjunto de herramientas y su código fuente están disponibles en Github.
Trabajos futuros
Se han identificado una serie de ámbitos para la labor futura. Los proveedores de datos se beneficiarían de herramientas para preparar sus datos vinculados. Las herramientas de validación implementadas en el conjunto de herramientas también pueden utilizarse en la creación de servicios para los proveedores de datos, lo que les permite verificar la validez de sus datos en etapas anteriores de la publicación de datos vinculados. Un primer paso en esta dirección se llevó a cabo probando los datos vinculados agregados utilizando el espacio controlado de pruebas Europeana Metis . Una segunda línea de trabajo que comenzará en 2021 se centrará en los componentes para la interoperabilidad y la integración del conjunto de herramientas en los sistemas de los agregadores. Este trabajo será coordinado por The Netherlands Institute for Sound and Vision en el proyecto nacional holandés Digitale Collectie.
Para obtener más información sobre los datos vinculados, vea nuestro seminario web de octubre de 2020 sobre LODA, el agregador de datos abiertos vinculados, y si está interesado en el tema y desea más oportunidades para discutirlo, únase a la comunidad EuropeanaTech.
Esta publicación se editó el 21 de enero de 2021 para actualizar los detalles de los futuros trabajos previstos en este ámbito.
