Agregação de dados ligados
Os dados vinculados são uma forma de publicar dados estruturados na web que permite que os metadados sejam conectados e enriquecidos. Isto garante que diferentes representações do mesmo conteúdo podem ser encontradas, e ligações feitas entre recursos relacionados. A agregação de dados interligados tem potencial para trazer benefícios em termos de custos e melhorar a interoperabilidade dos dados à escala mundial, e o projeto Europeana Common Culture investigou a viabilidade de utilizar esses dados interligados para a agregação.
A Europeana já opera um modelo escalável e sustentável de agregação de metadados para o setor do património cultural. A agregação de dados interligados significaria que os fornecedores de dados poderiam mais facilmente partilhar os seus metadados com agregadores do património cultural que utilizassem dados interligados. Para os fornecedores que ainda não publicam dados interligados, a sua aplicação para participação na Europeana proporcionar-lhes-ia também a vantagem de poderem utilizar os seus dados interligados para outras aplicações e com outros domínios para além do património cultural, como os motores de pesquisa na Internet.
Trabalhar com fornecedores de dados
Este projeto-piloto decorreu de maio de 2019 a junho de 2020. Foi coordenado pelo Netherlands Institute for Sound and Vision (NISV) e entregue em estreita colaboração com a Dutch Digital Heritage Network (NDE), que apoiou o projeto fornecendo conhecimento, software e infraestrutura para executar os testes. O projeto-piloto envolveu três tipos de participantes no ecossistema Europeana: fornecedores de dados, agregadores e a Fundação Europeana. Doze fornecedores de dados aderiram ao projeto-piloto, mas nem todos estavam plenamente conscientes dos desafios técnicos que esta nova abordagem traria. Quatro dos fornecedores não conseguiram fornecer um conjunto de dados como dados ligados e dois outros fornecedores forneceram conjuntos de dados com dados insuficientes para agregação na Europeana.
Nos seis casos bem-sucedidos, cinco fornecedores já dispunham de conhecimentos internos ou de uma aplicação existente de dados interligados e, por um lado, foi o seu primeiro esforço na publicação de dados interligados. A conclusão é que há muito interesse em implementar dados vinculados entre os provedores de dados. No entanto, exige um nível significativo de recursos quando uma organização não tem qualquer experiência anterior.
Resultados do projeto-piloto
O projeto-piloto aplicou uma abordagem para a agregação de dados ligados com base em duas especificações para a disponibilização de um conjunto de dados ligados para a Europeana. Estes projetos tinham sido anteriormente bem sucedidos num projeto-piloto de pequena escala no âmbito do projeto Ascensão da Literacia.
A primeira especificação é que os metadados ao nível do conjunto de dados devem ser fornecidos utilizando vocabulários bem conhecidos. Inclui os tipos de distribuições de conjuntos de dados que os provedores de dados podem usar e os metadados necessários para cada um.
Uma segunda especificação aborda a utilização de dados associados ao Schema.org para descrever bens do património cultural de acordo com os requisitos da Europeana e do Modelo de Dados da Europeana (EDM). Atualmente, a Europeana só suporta a ingestão de metadados no EDM. No entanto, as experiências de aplicação do Schema.org a descrições de metadados de bens do património cultural demonstraram que este pode fornecer dados de boa qualidade, capazes de cumprir os requisitos da Europeana. Esta especificação fornece um nível geral de orientação para a utilização de metadados Schema.org que, após a conversão para EDM, resultará em metadados adequados para agregação pela Europeana.
Este projeto-piloto resultou igualmente num conjunto de ferramentas para a agregação de dados interligados, concebido para ser utilizado pelos agregadores da Europeana e por agregadores de outras redes semelhantes. Embora a funcionalidade do conjunto de ferramentas seja adaptada para o EDM, os agregadores que utilizam outros modelos de dados podem adicionar as suas próprias conversões e validações utilizando os padrões implementados pelo conjunto de ferramentas. O conjunto de ferramentas baseia-se em contentores Docker que preservam a independência técnica das suas ferramentas, tornando a solução portátil para diferentes ambientes e escalável, dando a possibilidade de aplicar o conjunto de ferramentas a coleções pequenas ou grandes. O conjunto de ferramentas e o respetivo código-fonte estão disponíveis no Github.
Trabalhos futuros
Foram identificados vários domínios para trabalhos futuros. Os fornecedores de dados beneficiariam de ferramentas para preparar os seus dados interligados. As ferramentas de validação implementadas no conjunto de ferramentas também podem ser utilizadas na criação de serviços para os fornecedores de dados, permitindo-lhes verificar a validade dos seus dados em fases anteriores da publicação de dados ligados. Foi dado um primeiro passo nesse sentido, testando os dados agregados ligados utilizando a caixa de areia Europeana Metis. Uma segunda linha de trabalho, com início em 2021, centrar-se-á nos componentes para a interoperabilidade e a integração do conjunto de ferramentas nos sistemas dos agregadores. Este trabalho será coordenado pelo Instituto Neerlandês de Som e Visão no projeto nacional neerlandês Digitale Collectie.
Para saber mais sobre os dados interligados, consulte o nosso webinário de outubro de 2020 sobre o LODA - o agregador de dados abertos interligados e, se estiver interessado no tema e quiser ter mais oportunidades de o debater, junte-se à comunidade EuropeanaTech.
Esta publicação foi editada em 21 de janeiro de 2021 para atualizar os pormenores dos futuros trabalhos previstos neste domínio.
