Le collezioni di storia naturale nei musei di tutto il mondo sono depositi di enormi quantità di esemplari biologici conservati che documentano la biodiversità passata e presente del nostro pianeta, comprese molte specie estinte. Queste collezioni contengono oggetti come animali imbalsamati e montati, insetti appuntati, piante secche, semi e frutta, nonché tutti i tipi di fossili. In passato, la maggior parte di questi esemplari erano accessibili solo agli scienziati, ma oggi la digitalizzazione li rende sempre più visibili al pubblico. Gallerie virtuali di immagini e modelli 3D, nonché file video e audio, consentono di esplorare i tesori nascosti dei depositi del museo, che di solito sono off limits per i visitatori abituali. L'aggregatore di storia naturale di Europeana, OpenUp!, contribuisce attualmente al portale Europeana con 8,7 milioni di oggetti provenienti da 34 istituzioni. Tale fornitura di dati si basa su infrastrutture di dati consolidate nel settore della storia naturale, vale a dire il servizio di accesso alla raccolta biologica per l’Europa e lo strumento globale di informazione sulla biodiversità.
![Ursus thibetanus G.[Barone] Cuvier, 1823, Museumfür Naturkunde Berlino, Germania, CC BY-SA](/files/Images/Blog_images/2019-01/Ursusthibetanus.jpeg)
Per trovare questi oggetti nelle collezioni Europeana, il punto di accesso più comune è il nome dell'organismo. I biologi usano binomi (nomi costituiti da due parti, come Ursus maritimus per l'orso polare) per designare le specie. In contrasto con i nomi comuni in varie lingue, questi (latino) nomi sono utilizzati a livello internazionale. Le specie che condividono determinate caratteristiche sono raggruppate in generi, che a loro volta sono raggruppati in famiglie. Definendo diversi gruppi gerarchici di organismi con caratteristiche e ascendenze condivise (i cosiddetti taxa), i biologi (tassonomisti) creano tassonomie. La specie Ursus maritimus sarebbe al livello inferiore di tale tassonomia, insieme a Ursus arctos (orso bruno) e Ursus thibetanus (orso nero asiatico) appartiene al genere Ursus, che a sua volta appartiene alla famiglia degli Ursidae; Al livello più alto sarebbe Animalia come un regno.
Le tassonomie rappresentano la nostra comprensione della biodiversità e dell'evoluzione delle specie, che è oggetto di ricerca permanente. Di conseguenza, le tassonomie sono in flusso costante. Man mano che vengono scoperte nuove specie, verranno aggiunti nuovi nomi. La ricerca sistematica potrebbe scoprire che una determinata specie è più strettamente correlata a un altro genere, cosicché una parte del binomio della specie deve essere modificata. Un genere potrebbe essere fuso con un altro genere o diviso in diversi generi, il che richiede che i nomi di diverse specie vengano modificati. Interi gruppi di taxon possono essere spostati in altre parti dell'albero gerarchico come risultato della conoscenza recentemente scoperta di antenati comuni, ad esempio nei casi in cui le caratteristiche morfologiche tradizionalmente utilizzate devono essere riconsiderate alla luce delle prove molecolari. Particolarità come omonimi (nomi identici per specie diverse) e sinonimi (diversi nomi per una specie) si sommano alle difficoltà relative alle tassonomie. La complessità della gestione di tali dati dinamici ha dato origine al nuovo campo del calcolo tassonomico.

Le tassonomie tradizionali spesso si riferiscono a un gruppo definito di organismi, ad esempio una certa famiglia, classe o regno, e si riferiscono a una certa regione geografica, in cui il gruppo descritto è ben noto e documentato. Esempi sono le "liste di controllo tassonomiche" regionali come Euro + Med PlantBase (piante vascolari dell'Europa e della regione mediterranea) e Fauna Europaea (animali terrestri e d'acqua dolce europei), che sono sforzi congiunti di tassonomi di molte istituzioni e sono costantemente aggiornati. Iniziative come la Pan-European Species-directories Infrastructure (PESI) uniscono tassonomie di diverse comunità in un'unica checklist all-taxa. Iniziative analoghe esistono a livello mondiale: Il Catalogo della Vita raggruppa i dati di 168 database tassonomici in un indice autorevole di specie note di animali, piante, funghi e microrganismi, che attualmente elenca 1,8 milioni delle 1,9 milioni di specie nominate al mondo. La tassonomia della spina dorsale del GBIF si basa sul catalogo della vita ed è regolarmente assemblata in un processo automatico da 56 fonti.
Inutile dire che la decisione su quale lista di controllo dovrebbe essere utilizzata per una raccolta dipende dalla copertura tassonomica e geografica. Le tassonomie sono sottoposte ad aggiornamenti costanti, pertanto l'abbinamento degli oggetti di raccolta a una delle liste di controllo menzionate dovrebbe essere effettuato a intervalli regolari. La maggior parte di essi sono disponibili attraverso servizi web che consentono una facile integrazione nelle infrastrutture e nei prodotti esistenti. Liste di controllo sinonimizzate regionali e globali come PESI e Catalogo della vita possono essere utilizzate per implementare meccanismi di espansione delle query che estendono le query degli utenti per un taxon a tutti i sinonimi noti di questo taxon. Tali funzioni di espansione delle query sono già all'avanguardia nei portali sulla biodiversità.
Per gli esemplari di storia naturale, gli identificatori di dati aperti collegati sono stati ampiamente utilizzati nel recente passato, ad esempio implementando gli identificatori stabili HTTP del consorzio di strutture tassonomiche europee (CETAF). Per i taxa si stanno discutendo iniziative simili, ma l'incertezza intrinseca e il flusso costante di tassonomie rendono i taxa non facili da comprendere e ostacolano tali sforzi.
Un problema che non può essere risolto utilizzando tassonomie canoniche è la questione delle identificazioni errate – esemplari scambiati per una determinata specie, il che comporta l'uso di nomi errati per gli oggetti. Questo non può essere completamente evitato considerando che alcune collezioni contengono milioni di esemplari, che non possono essere aggiornati costantemente. Quindi questo dovrebbe essere preso in considerazione quando si utilizzano i dati.

Per OpenUp!, non viene utilizzata una tassonomia uniforme per gli oggetti campione. Poiché i dati sono forniti da istituzioni che sono esperti nei rispettivi campi, ci si aspetta che applichino liste di controllo appropriate sui loro dati prima di alimentarli con OpenUp. Tuttavia, per aumentare l'accessibilità, OpenUp! arricchisce i metadati degli oggetti con nomi comuni in 300 lingue e dialetti, in modo che una specie possa essere trovata (con una certa certezza) senza conoscerne il nome scientifico. Un ulteriore arricchimento include collegamenti alla letteratura scientifica disponibile nella Biodiversity Heritage Library (BHL), un consorzio dedicato a rendere accessibile online la letteratura esistente sulla biodiversità.
Riconoscimenti: Desidero ringraziare i miei colleghi Walter Berendsohn, Petra Böttinger, Gabi Dröge, Anton Güntsch, Agnes Kirchhoff e Gerda Koch per i loro preziosi commenti e suggerimenti.
Attribuzioni delle immagini:
- Ursus thibetanus G.[Barone] Cuvier, 1823, Museumfür Naturkunde Berlino, Germania, CC BY-SA
- I sette principali gradi tassonomici di una classificazione biologica, Peter Halasz, Wikimedia Commons, Public Domain.
- Testudo hermanni Gmelin, 1789, Muséum national d'Histoire naturelle, Francia, CC BY-NC-ND
