Os Princípios Orientadores FAIR para a gestão e gestão de dados científicos destinam-se a melhorar a infraestrutura e os serviços em torno de dados académicos. Estes princípios, tal como apresentados no sítio Web GO FAIR que os acolhe, destinam-se a ser «orientações para melhorar a facilidade de localização, a acessibilidade, a interoperabilidade e a reutilização de ativos digitais». Orientam agora a conceção e a execução de iniciativas importantes, como a Nuvem Europeia para a Ciência Aberta (EOSC),tal como ilustrado pelo projeto FAIRsFAIR recentemente lançado.
As Coleções Europeana e as suas API disponibilizam o património cultural digitalizado de mais de 3 700 fornecedores (galerias, bibliotecas, museus e arquivos) em todas as línguas europeias. A Europeana Research quer que mais pessoas utilizem este material na investigação académica, especialmente nas ciências humanas.
Estamos a explorar possibilidades de ligação com a EOSC, que também atende às necessidades de investigação nas ciências sociais e humanas. Neste contexto, de que forma os serviços da Europeana cumprem os princípios FAIR e como podemos desempenhar um papel na adoção mais ampla destes princípios no setor do património cultural?
Como se alinham os princípios FAIR com os da Europeana?
Existe muita ressonância entre os princípios FAIR e os valores e objetivos da Europeana, tal como consagrados na sua estratégia. Os nossos princípios «Utilizável, Mútuo, Fiável» e a forma como os implementámos nos últimos dez anos estão em consonância com os princípios «Encontrável, Acessível, Interoperável, Reutilizável» da própria FAIR. Temos estado envolvidos no desenvolvimento de tecnologia que tem grande potencial para melhorar a FAIRness dos dados, como APIs web abertas, Linked Data e o International Image Interoperability Framework (IIIF), implementando-o para nós mesmos e incentivando todos no nosso setor a adotá-lo.
A Europeana e a sua vasta rede de parceiros desenvolveram um quadro de licenciamento que permite metadados totalmente abertos e a rotulagem obrigatória de conteúdos com declarações de direitos normalizadas e interoperáveis que tornam claras as possibilidades de reutilização de cada artigo. Também defendemos a adoção de melhores políticas de direitos de autor que facilitem a partilha aberta de dados culturais em todos os domínios. Por último, a grande rede de parceiros de dados da Europeana trabalhou no sentido de melhorar a qualidade dos dados fornecidos, num esforço para tornar os nossos dados muito diversificados mais utilizáveis em todos os domínios e línguas.
![[Ontwerp:] S[ocié]té A[nony]me de l'Exposition universelle et internationale de Gand 1913. Entrée principale (em inglês). Cupe A-B](/files/Images/Blog_images/2019-04/Ghent.jpg)
[Ontwerp:] S[ocié]té A[nony]me de l'Exposition universelle et internationale de Gand 1913. Entrée principale (em inglês). Coupe A-B,Oscar Henricus Van de Voorde, 1913, Biblioteca da Universidade de Gante, CC BY-SA

De que forma os dados e serviços da Europeana cumprem os requisitos FAIR?
Europeana agrega registos de metadados sobre bens do património cultural. Estes registos fornecem ligações para conteúdos digitalizados acessíveis nos sítios Web dos parceiros da Europeana e alimentam um serviço de pesquisa que facilita a descoberta de material cultural para uma grande variedade de públicos. Tanto os dados como os serviços são apresentados através de uma plataforma Web e de uma série de API. Por conseguinte, há vários níveis a ter em conta na avaliação da FAIRness da oferta da Europeana.
F- Para ser encontrado
O conteúdo digitalizado a que a Europeana dá acesso é descrito por metadados, cuja agregação constitui a espinha dorsal dos serviços da Europeana. A escala e a diversidade dos conjuntos de metadados da Europeana implicam que a sua riqueza varia consideravelmente. Mas a Europeana dotou-se de um modelo de dados (ver infra) que segue os princípios dos dados interligados, que dão, para além da flexibilidade, a possibilidade aos nossos parceiros - ou à própria Europeana - de enriquecer os metadados com ligações a recursos semânticos (multilingues) que também descrevem o «contexto» dos bens culturais, tornando-os mais fáceis de encontrar.
Como mencionado anteriormente, indexamos o conjunto de dados da Europeana e tornamo-lo pesquisável em linha. Além disso, o conjunto de dados pode ser encontrado através das infraestruturas de investigação europeias CLARIN e EUDAT.
A Europeana e os nossos parceiros promovem a identificação persistente dos metadados e das versões digitais dos objetos do património cultural. A Europeana atribui identificadores a cada registo agregado e dispõe de procedimentos para apoiar a persistência dos seus identificadores sempre que possível. Os identificadores Europeana são URI e estão incluídos nos registos de dados em todos os formatos em que o conjunto de dados está disponível. Num contexto de agregação em que os dados são transmitidos e processados entre diferentes parceiros, não podemos (e, para as preocupações de proveniência, não queremos) impor a singularidade global, ou seja, pode haver vários identificadores para várias versões de um recurso. Mas tentamos manter ligações em todas estas versões para que os consumidores dos nossos serviços possam sempre encontrar o que procuram.
A - Para ser acessível
Os identificadores da Europeana são URI resolvíveis (HTTP), que orientam os utilizadores e os serviços que consomem dados para páginas do nosso sítio Web ou dados das nossas API. A Europeana também tenta resolver URI obsoletos e atualizados por razões técnicas, utilizando o redirecionamento HTTP.
O conjunto de dados da Europeana é acessível através de API Web que implementam protocolos abertos e normalizados, como os protocolos e práticas de dados ligados (incluindo o SPARQL), o OpenSearch e o OAI-PMH.
O acesso aos registos do conjunto de dados através dos seus URI é gratuito e não é necessária autenticação. Algumas API (como a API de Anotações)e partes da nossa plataforma (como a Europeana 1914-1918)exigem autenticação, uma vez que permitem a modificação dos nossos dados.
I - Para ser interoperável
A Europeana utiliza o Modelo de Dados da Europeana (EDM) para o intercâmbio de dados com fornecedores de dados, para o seu sistema de informação interno e também para utilização por terceiros. O EDM é um modelo colaborativo de base comunitária, desenvolvido em consulta com representantes de todos os domínios representados na Europeana. Está em constante melhoria. O EDM baseia-se no Resource Description Framework (RDF), que nos permite criar um modelo para os nossos metadados que reutiliza principalmente vocabulários padrão existentes (Linked Data), como Dublin Core, SKOS e FOAF.
A Europeana apoia os seus parceiros de dados na utilização de vocabulários para fazer referência a conceitos, locais, pessoas e organizações. Os vocabulários mais proeminentes utilizados no conjunto de dados são DBpedia e Geonames. A nossa utilização de vocabulários externos para enriquecimento segue sempre as práticas habituais dos dados abertos interligados e preocupações como a qualidade e o acesso.
Note-se que, em alguns casos cruciais para a Europeana, começámos a criar os nossos próprios vocabulários, como o da RightsStatements.org (ver abaixo), para complementar as normas existentes. Mais uma vez, tal é orientado para a comunidade e segue as melhores práticas existentes (como a disponibilização de URI).
R - Para ser reutilizável
Facilitar a reutilização de dados sobre o património cultural é um objetivo fundamental da Europeana.
Quaisquer metadados fornecidos à Europeana têm de ser licenciados ao abrigo do CC0 e a Europeana disponibiliza abertamente o conjunto completo de metadados agregados (incluindo os resultados das suas próprias melhorias de dados) também ao abrigo do CC0.
Os direitos de utilização dos conteúdos são indicados em todos os registos, utilizando declarações de direitos de Creative Commons ou RightsStatements.org, sendo este último um vocabulário desenvolvido como uma iniciativa comunitária para melhorar a comunicação do estatuto de direitos de autor e de reutilização dos objetos digitais pelas instituições responsáveis pelo património cultural, tornando mais fácil para os utilizadores «ver se e como as obras do património cultural em linha podem ser reutilizadas».
A proveniência dos dados é sempre indicada, reconhecendo o fornecedor de dados original (por exemplo, um museu ou biblioteca) e todos os intermediários no fluxo de trabalho de agregação nos metadados.
Por último, os nossos metadados são disponibilizados com a utilização de normas de dados habitualmente utilizadas nos domínios do património cultural, da educação e da investigação, como Schema.org, Dublin Core, SKOS e outros (graças, em parte, ao facto de a EDM seguir as melhores práticas em matéria de modelização de dados e já se basear nessas normas).
O que fará a Europeana num futuro próximo?
Para incentivar ainda mais os parceiros a fornecerem dados mais ricos que tornem o património cultural digital mais localizável e mais reutilizável, a Europeana tem em curso esforços de qualidade dos dados para partilhar boas práticas e comunicar informações sobre a qualidade dos conteúdos e metadados de uma forma útil e motivadora, tanto para os fornecedores como para os utilizadores.
Recentemente, definimos medidas para a qualidade dos metadados, identificando os principais elementos de dados e valores que permitem interfaces de utilizador ricas e uma melhor experiência do utilizador. Nos próximos meses, vamos tornar estas medições acessíveis aos nossos reutilizadores de dados, para que possam identificar o material que lhes é mais útil.
No que diz respeito à acessibilidade dos conteúdos digitalizados, a Europeana é membro fundador do novo Quadro Internacional de Interoperabilidade da Imagem (IIIF). O IIIF é um conjunto de APIs abertas projetadas para ajudar as pessoas a publicar conteúdo digital na web de uma forma mais interoperável, permite uma interação mais rica com o conteúdo em todos os repositórios e mantém um melhor registro da proveniência do conteúdo. A Europeana reconhece e explora o conteúdo do IIIF que nos é fornecido e trabalha arduamente para incentivar os nossos parceiros de dados a adotá-lo.
Outros desenvolvimentos relevantes para as métricas FAIR incluem a futura aplicação de um mecanismo de autorização de início de sessão único em todos os nossos produtos e o esforço contínuo para adaptar o nosso modelo de dados às novas necessidades de aplicação e partilha de dados, de uma forma orientada para a comunidade (um exemplo recente é uma extensão para representar e publicar o conteúdo integral dos jornais).
Mantenha-se informado e junte-se a nós
Para se manter informado sobre desenvolvimentos como os descritos neste post, junte-se à Europeana Research e/ou às comunidades EuropeanaTech da Europeana Network Association e siga-nos no Twitter (@eurresearch e @europeanatech)
Esta publicação foi editada em 1 de fevereiro de 2022 para clarificar a forma como a Europeana atribui identificadores aos registos.
