Como o nosso foco de janeiro na Europeana Pro News demonstrou, o Metis Sandbox responde a uma necessidade real, permitindo que os agregadores e as instituições responsáveis pelo património cultural executem um fluxo de trabalho completo de ingestão dos seus dados. Isto significa que podem testar os seus dados, rever os registos resultantes e obter informações imediatas sobre a qualidade dos dados, permitindo-lhes resolver quaisquer problemas antes de os apresentarem à Europeana.
As reações adicionais em matéria de qualidade assumem a forma de um relatório completo sobre os cálculos dos níveis (para mais informações sobre os nossos níveis de qualidade dos dados, ver Europeana Publishing Framework) e a sinalização de avisos de campo (padrões nos dados que podem indicar problemas a resolver). Recentemente, foram desenvolvidos recursos de formação e um extenso guia do utilizador para o Sandbox e a aplicação está a ganhar força como ferramenta de diagnóstico para parceiros de dados.
Neste último artigo da revista Metis Sandbox, vamos olhar para o futuro. A caixa de areia Metis tem sido uma componente fundamental da estratégia de agregação desde a sua criação e é um produto fundamental da Iniciativa Europeana.
Temos muitos planos e desejos para a aplicação que esperamos realizar nos próximos meses e anos. Mas, tanto no desenvolvimento de software como noutros domínios, temos de garantir que a nossa fundação é sólida. Será necessário dedicar alguma atenção à consolidação da aplicação após o recente período de crescimento funcional.
Como consolidar o que já temos?
O principal motor dos nossos esforços de consolidação é o da procura esperada. À medida que mais e mais pessoas começarem a usar o Sandbox, esperamos que, a menos que tomemos medidas, as filas de conjuntos de dados comecem a se desenvolver e as pessoas terão que esperar mais tempo para que seus conjuntos de dados sejam processados. É claro que um pouco de fila é inevitável numa aplicação como esta e vai e vem com variações na procura. Mas deve ser contido a níveis aceitáveis e não levar a erros ou a uma má experiência do utilizador. Para o efeito, estamos a trabalhar na capacidade de expansão da aplicação, bem como na otimização da sua componente de tratamento de dados. Além disso, estamos a ponderar formas de sinalizar mais claramente ao utilizador que, embora exista atualmente uma fila, os seus dados estão a caminho.
Outra coisa em que estamos a trabalhar é a experiência do utilizador em geral. A interface Sandbox cresceu organicamente, juntamente com a funcionalidade, e, apesar de ter recebido muita atenção de nossos desenvolvedores, nunca foi projetada de forma holística. Agora que a funcionalidade está a tornar-se estabelecida, é um bom momento para olhar para o design visual. A nossa equipa de design já começou a alinhar a interface com o estilo da casa Europeana e a encontrar formas de melhorar a experiência do utilizador. Realizaremos sessões de recolha de opiniões dos utilizadores para nos ajudar neste esforço.
Que novas funcionalidades vamos adicionar à Sandbox?
Há muitas coisas em que estamos ou estaremos a trabalhar que esperamos que melhorem a vida dos nossos parceiros de dados. Por exemplo, as pessoas que usam o Sandbox frequentemente comentam que, dado que o Sandbox processa os primeiros 1000 registros que encontra em um conjunto de dados, o feedback que ele dá nem sempre é representativo de todo o conjunto. Estamos a trabalhar para permitir que o utilizador defina uma compensação de amostragem, o que deverá permitir-lhe obter a caixa de areia para processar uma amostra representativa, selecionando os registos de forma mais uniforme em todo o conjunto de dados.
Outro pedido que obtemos ocasionalmente é para relatórios de cálculo de nível estendido que também contenham estatísticas que abranjam toda a amostra do conjunto de dados, em vez de apenas os detalhes de um registro isoladamente. Isto também é algo em que estaremos a trabalhar num futuro próximo.
As reações dos agregadores dizem-nos que a funcionalidade que o Sandbox oferece seria útil nas fases iniciais dos fluxos de trabalho dos agregadores, especificamente aquando da preparação e do mapeamento dos dados. Estamos a trabalhar para resolver este problema, disponibilizando algumas funcionalidades como uma API, o que significa que as pessoas podem utilizá-la em qualquer momento do seu processo de agregação.
Por último, estamos a acrescentar ao nosso repertório de avisos de campo (ou seja, padrões de problemas). A lista atual consiste em oito tipos de avisos, tudo a ver com títulos de registros e descrições. Os novos avisos de campo podem abranger mais e diferentes campos e, por conseguinte, dar uma resposta mais abrangente aos utilizadores do Sandbox. O Comité da Qualidade dos Dados trabalhará na seleção e definição de prioridades a partir de uma lista de opções e, em seguida, aplicá-las-emos no ambiente de testagem.
E a médio e a longo prazo?
Uma vez que estamos a construir o espaço comum europeu de dados para o património cultural, a Iniciativa Europeana está a debater e a conceber melhorias e melhorias do Modelo de Dados Europeana e do Quadro de Edição Europeana. A evolução da situação poderá ter de se refletir na caixa de areia da Metis; por exemplo, esperamos algumas melhorias no tratamento de registos 3D, que é identificado como uma prioridade para o espaço de dados. As futuras atualizações da estratégia de agregação também se refletirão na caixa de areia da Metis e, espera-se, melhorarão o percurso de publicação de dados para as instituições e agregadores do património cultural.
Mais informações
Esta é a última publicação de notícias da Europeana Pro News de janeiro centrada na Metis Sandbox. Esperamos que esta série tenha lhe dado uma ideia do que a Sandbox pode fazer agora e o que fará no futuro. Estamos ansiosos para ouvir os nossos utilizadores da Sandbox: a aplicação tem uma funcionalidade de feedback que o encorajamos a utilizar. Enquanto isso, por favor, continue a ler Pro News para mais informações sobre outros tópicos fascinantes!
