Les collections d'histoire naturelle dans les musées du monde entier sont des dépôts d'énormes quantités de spécimens biologiques préservés qui documentent la biodiversité passée et présente de notre planète, y compris de nombreuses espèces éteintes. Ces collections contiennent des objets comme des animaux en peluche et montés, des insectes épinglés, des plantes séchées, des graines et des fruits ainsi que toutes sortes de fossiles. Dans le passé, la plupart de ces spécimens n'étaient accessibles qu'aux scientifiques, mais aujourd'hui, la numérisation les rend de plus en plus visibles pour le public. Des galeries virtuelles d’images et de modèles 3D, ainsi que des vidéos et des fichiers audio, permettent d’explorer les trésors cachés des dépôts du musée, qui sont généralement interdits aux visiteurs réguliers. OpenUp!, l’agrégateur d’histoire naturelle d’Europeana, contribue actuellement au portail Europeana à hauteur de 8,7 millions d’objets provenant de 34 institutions. Cette fourniture de données repose sur des infrastructures de données établies dans le domaine de l’histoire naturelle, à savoir le service d’accès aux collections biologiques pour l’Europe et le mécanisme mondial d’information sur la biodiversité.
![Ursus thibetanus G.[Baron] Cuvier, 1823, Museumfür Naturkunde Berlin, Allemagne, CC BY-SA](/files/Images/Blog_images/2019-01/Ursusthibetanus.jpeg)
Pour trouver ces objets dans Europeana Collections, le point d’accès le plus courant est le nom de l’organisme. Les biologistes utilisent des binômes – des noms composés de deux parties, comme Ursus maritimus pour l’ours polaire – pour désigner les espèces. Contrairement aux noms communs dans diverses langues, ces noms (latinisés) sont utilisés à l'échelle internationale. Les espèces partageant certaines caractéristiques sont regroupées en genres, qui à leur tour sont regroupés en familles. En définissant plusieurs groupes hiérarchiques d'organismes ayant des caractéristiques et des ancêtres communs (appelés taxons), les biologistes (taxonomistes) créent des taxonomies. L’espèce Ursus maritimus serait au niveau inférieur d’une telle taxonomie, avec Ursus arctos (ours brun) et Ursus thibetanus (ours noir d’Asie), elle appartient au genre Ursus, qui appartient à son tour à la famille des Ursidae; au plus haut niveau serait Animalia en tant que royaume.
Les taxonomies représentent notre compréhension de la biodiversité et de l'évolution des espèces, qui fait l'objet de recherches permanentes. Par conséquent, les taxonomies sont en flux constant. Au fur et à mesure que de nouvelles espèces sont découvertes, de nouveaux noms seront ajoutés. Des recherches systématiques pourraient révéler qu’une certaine espèce est plus étroitement liée à un autre genre, de sorte qu’une partie du binôme de l’espèce doit être modifiée. Un genre peut être fusionné avec un autre genre ou divisé en plusieurs genres, ce qui nécessite que plusieurs noms d'espèces soient modifiés. Des groupes entiers de taxons peuvent être déplacés vers d'autres parties de l'arbre hiérarchique à la suite de connaissances nouvellement découvertes sur l'ascendance commune, par exemple dans les cas où les caractéristiques morphologiques traditionnellement utilisées doivent être reconsidérées à la lumière de preuves moléculaires. Des particularités telles que les homonymes (noms identiques pour différentes espèces) et les synonymes (plusieurs noms pour une espèce) ajoutent aux difficultés liées aux taxonomies. La complexité du traitement de ces données dynamiques a donné naissance au nouveau domaine de l'informatique taxonomique.

Les taxonomies traditionnelles traitent souvent d'un groupe défini d'organismes, par exemple une certaine famille, classe ou royaume, et se réfèrent à une certaine région géographique, dans laquelle le groupe décrit est bien connu et documenté. Des «listes de contrôle taxonomiques» régionales, telles que Euro + Med PlantBase (plantes vasculaires d’Europe et de la région méditerranéenne) et Fauna Europaea (animaux terrestres et d’eau douce européens), constituent des efforts conjoints de taxonomistes de nombreuses institutions et sont constamment mis à jour. Des initiatives telles que l'infrastructure des répertoires paneuropéens des espèces (PESI) fusionnent les taxonomies de différentes communautés en une liste de contrôle unique pour tous les taxons. Des initiatives similaires existent au niveau mondial: Le Catalogue of Life regroupe les données de 168 bases de données taxonomiques dans un index faisant autorité des espèces connues d'animaux, de plantes, de champignons et de micro-organismes, qui répertorie actuellement 1,8 million des 1,9 million d'espèces nommées dans le monde. La taxonomie de base du GBIF s’appuie sur le catalogue de la vie et est régulièrement assemblée selon un processus automatique à partir de 56 sources.
Il va sans dire que la décision sur la liste de contrôle à utiliser pour une collecte dépend de la couverture taxonomique et géographique. Les taxonomies subissent des mises à jour constantes, de sorte que l'appariement des objets de collection à l'une des listes de contrôle mentionnées doit être effectué à intervalles réguliers. La plupart d'entre eux sont disponibles via des services Web qui permettent une intégration facile dans les infrastructures et les produits existants. Des listes de contrôle synonymisées régionales et mondiales telles que PESI et le Catalogue of Life peuvent être utilisées pour mettre en œuvre des mécanismes d'expansion des requêtes qui étendent les requêtes des utilisateurs pour un taxon à tous les synonymes connus de ce taxon. Ces fonctions d'expansion des requêtes sont déjà à la pointe de la technologie dans les portails sur la biodiversité.
Pour les spécimens d'histoire naturelle, les identifiants de données ouvertes liées sont devenus largement utilisés dans un passé récent, par exemple en mettant en œuvre les identifiants stables HTTP du Consortium of European Taxonomic Facilities (CETAF). Pour les taxons, des initiatives similaires sont en cours de discussion, mais l'incertitude inhérente et le flux constant de taxonomies rendent les taxons difficiles à saisir et entravent ces efforts.
Un problème qui ne peut être résolu par l’utilisation de taxonomies canoniques est la question des erreurs d’identification, c’est-à-dire des spécimens confondus avec une certaine espèce, ce qui entraîne l’utilisation de noms incorrects pour les objets. Cela ne peut être complètement évité étant donné que certaines collections contiennent des millions de spécimens, qui ne peuvent pas être mis à jour constamment. Cela doit donc être pris en compte lors de l'utilisation des données.

Pour OpenUp!, aucune taxonomie uniforme n'est utilisée pour les spécimens d'objets. Comme les données sont fournies par des institutions qui sont des experts dans leurs domaines respectifs, on s'attend à ce qu'elles appliquent des listes de contrôle appropriées sur leurs données avant de les alimenter en OpenUp. Toutefois, pour accroître l’accessibilité, OpenUp! enrichit les métadonnées des objets avec des noms communs dans 300 langues et dialectes, de sorte qu’une espèce peut être trouvée (avec une certaine certitude) sans connaître son nom scientifique. Un enrichissement supplémentaire comprend des liens vers la littérature scientifique disponible dans la Bibliothèque du patrimoine de la biodiversité (BHL), un consortium dédié à rendre accessible en ligne la littérature existante sur la biodiversité.
Remerciements: Je tiens à remercier mes collègues Walter Berendsohn, Petra Böttinger, Gabi Dröge, Anton Güntsch, Agnes Kirchhoff et Gerda Koch pour leurs précieuses observations et suggestions.
Attributions des images:
- Ursus thibetanus G.[Baron] Cuvier, 1823, Museumfür Naturkunde Berlin, Allemagne, CC BY-SA
- Les sept principaux rangs taxonomiques d’une classification biologique, Peter Halasz, Wikimedia Commons, domaine public.
- Testudo hermanni Gmelin, 1789, Muséum national d'Histoire naturelle, France, CC BY-NC-ND
