Comme l'a montré notre focus Europeana Pro News de janvier, le Metis Sandbox répond à un besoin réel en permettant aux agrégateurs et aux institutions du patrimoine culturel de gérer un flux de travail d'ingestion complet sur leurs données. Cela signifie qu'ils peuvent tester leurs données, examiner les enregistrements qui en résultent et obtenir un retour d'information immédiat sur la qualité des données, ce qui leur permet de résoudre tous les problèmes avant de les soumettre à Europeana.
Un retour d’information supplémentaire sur la qualité prend la forme d’un rapport complet sur les calculs des niveaux (pour plus d’informations sur nos niveaux de qualité des données, voir le cadre de publication Europeana)et de la signalisation des avertissements sur le terrain (modèles dans les données susceptibles d’indiquer des problèmes à résoudre). Récemment, des ressources de formation et un guide d'utilisation complet ont été développés pour le Sandbox et l'application gagne du terrain en tant qu'outil de diagnostic pour les partenaires de données.
Dans ce dernier article de Metis Sandbox, nous nous tournerons vers l’avenir. Le Metis Sandbox est un élément clé de la stratégie d'agrégation depuis sa création et est un produit essentiel de l'initiative Europeana.
Nous avons beaucoup de plans et de souhaits pour l'application que nous espérons réaliser dans les mois et les années à venir. Mais, dans le développement de logiciels comme dans d’autres domaines, nous devons nous assurer que notre base est solide. Une certaine attention devra être accordée à la consolidation de l'application après la récente période de croissance fonctionnelle.
Comment consolidons-nous ce que nous avons déjà?
Le principal moteur de nos efforts de consolidation est celui de la demande attendue. Comme de plus en plus de gens commenceront à utiliser la Sandbox, nous nous attendons à ce que, à moins que nous ne prenions des mesures, les files d'attente des ensembles de données commencent à se développer et les gens devront attendre plus longtemps pour que leurs ensembles de données soient traités. Un peu de file d'attente est bien sûr inévitable dans une application comme celle-ci et va et vient avec les variations de la demande. Mais il devrait être contenu à des niveaux acceptables et ne pas conduire à des erreurs ou une mauvaise expérience utilisateur. À cette fin, nous travaillons sur la capacité de l’application à se développer, ainsi que sur l’optimisation de sa composante de traitement des données. En outre, nous étudions les moyens de signaler plus clairement à l’utilisateur que, même s’il y a actuellement une file d’attente, ses données sont en cours de traitement.
Une autre chose sur laquelle nous travaillons est l’expérience utilisateur en général. L'interface Sandbox s'est développée organiquement avec la fonctionnalité et, même si elle a reçu beaucoup d'attention de la part de nos développeurs, n'a jamais été conçue de manière holistique. Maintenant que la fonctionnalité est en train de s'établir, c'est un bon moment pour regarder le design visuel. Notre équipe de conception a déjà commencé à adapter l'interface au style de la maison Europeana et à trouver des moyens d'améliorer l'expérience utilisateur. Nous organiserons des séances de retour d’information des utilisateurs pour nous aider dans cette entreprise.
Quelles nouvelles fonctionnalités ajouterons-nous à la Sandbox?
Il y a beaucoup de choses sur lesquelles nous travaillons ou allons travailler et qui, nous l'espérons, amélioreront la vie de nos partenaires de données. Par exemple, les personnes qui utilisent la Sandbox commentent souvent que, étant donné que la Sandbox traite les 1 000 premiers enregistrements qu'elle trouve dans un ensemble de données, les commentaires qu'elle donne ne sont pas toujours représentatifs de l'ensemble. Nous travaillons à permettre à l’utilisateur de définir un décalage d’échantillonnage, ce qui devrait lui permettre de faire en sorte que la Sandbox traite un échantillon représentatif en sélectionnant les enregistrements de manière plus uniforme dans l’ensemble de données.
Une autre demande que nous recevons occasionnellement concerne les rapports de calcul de niveau étendu qui contiennent également des statistiques couvrant l'ensemble de l'échantillon de données au lieu de seulement les détails d'un enregistrement isolément. C'est aussi quelque chose sur lequel nous travaillerons dans un proche avenir.
Les retours d’information des agrégateurs nous indiquent que la fonctionnalité offerte par Sandbox serait utile aux premières étapes des flux de travail des agrégateurs, en particulier lors de la préparation et de la cartographie des données. Nous travaillons à résoudre ce problème en rendant certaines fonctionnalités disponibles en tant qu'API, ce qui signifie que les gens peuvent l'utiliser à tout moment dans leur processus d'agrégation.
Enfin, nous ajoutons à notre répertoire d’avertissements sur le terrain (c’est-à-dire les modèles de problèmes). La liste actuelle se compose de huit types d'avertissements, tous liés aux titres d'enregistrement et aux descriptions. De nouveaux avertissements de champ pourraient couvrir des champs plus nombreux et différents, et donc donner un retour d'information plus complet aux utilisateurs de Sandbox. Le comité de la qualité des données s’emploiera à les sélectionner et à les hiérarchiser à partir d’une liste d’options, et nous les mettrons ensuite en œuvre dans le bac à sable.
Qu'en est-il du moyen et du long terme?
Alors que nous construisons l’espace européen commun des données pour le patrimoine culturel, l’initiative Europeana examine et conçoit des améliorations et des perfectionnements du modèle de données Europeana et du cadre d’édition Europeana. Les développements dans ce domaine devront peut-être être reflétés dans le Metis Sandbox; Par exemple, nous nous attendons à des améliorations dans le traitement des enregistrements 3D, ce qui est identifié comme une priorité pour l'espace de données. Les futures mises à jour de la stratégie d'agrégation seront également reflétées dans le Metis Sandbox et, espérons-le, amélioreront le parcours de publication des données pour les institutions et les agrégateurs du patrimoine culturel.
En savoir plus
Ceci est le dernier article de notre focus Europeana Pro News de janvier sur le Metis Sandbox. Nous espérons que cette série vous a donné une idée de ce que le Sandbox peut faire maintenant et de ce qu'il fera à l'avenir. Nous sommes impatients d'entendre nos utilisateurs de Sandbox: l'application dispose d'une fonctionnalité de feedback que nous vous encourageons à utiliser. Pendant ce temps, continuez à lire Pro News pour en savoir plus sur d'autres sujets fascinants!
