Coleções de história natural em museus de todo o mundo são repositórios de enormes quantidades de espécimes biológicos preservados que documentam a biodiversidade passada e presente do nosso planeta, incluindo muitas espécies extintas. Essas coleções contêm objetos como animais recheados e montados, insetos presos, plantas secas, sementes e frutas, bem como todos os tipos de fósseis. No passado, a maioria destes espécimes eram acessíveis apenas aos cientistas, mas hoje a digitalização torna-os cada vez mais visíveis para o público. As galerias virtuais de imagens e modelos 3D, bem como os vídeos e ficheiros áudio, permitem explorar os tesouros escondidos dos depósitos do museu, que estão normalmente fora dos limites para os visitantes regulares. O agregador de história natural da Europeana, OpenUp!, contribui atualmente com 8,7 milhões de objetos de 34 instituições para o portal Europeana. Este fornecimento de dados baseia-se em infraestruturas de dados estabelecidas no domínio da história natural, a saber, o Serviço de Acesso à Recolha Biológica para a Europa e o Mecanismo Mundial de Informação sobre Biodiversidade.
![Ursus thibetanus G.[Barão] Cuvier, 1823, Museumfür Naturkunde Berlim, Alemanha, CC BY-SA](/files/Images/Blog_images/2019-01/Ursusthibetanus.jpeg)
Para encontrar estes objetos nas Coleções Europeana, o ponto de acesso mais comum é o nome do organismo. Os biólogos utilizam binómios – nomes compostos por duas partes, como Ursus maritimus para o urso polar – para designar espécies. Em contraste com os nomes comuns em várias línguas, estes nomes (latinizados) são usados internacionalmente. As espécies que partilham determinadas características são agrupadas em géneros que, por sua vez, são agrupados em famílias. Ao definir vários grupos hierárquicos de organismos com características e ascendência partilhadas (os chamados taxa), os biólogos (taxonomistas) criam taxonomias. A espécie Ursus maritimus situar-se-ia no nível inferior dessa taxonomia, juntamente com Ursus arctos (urso castanho) e Ursus thibetanus (urso negro asiático), pertencendo ao género Ursus, que, por sua vez, pertence à família dos Ursidae; No nível superior seria Animalia como um reino.
As taxonomias representam a nossa compreensão da biodiversidade e evolução das espécies, que está sujeita a investigação permanente. Consequentemente, as taxonomias estão em fluxo constante. À medida que novas espécies forem descobertas, novos nomes serão adicionados. A investigação sistemática pode revelar que uma determinada espécie está mais estreitamente relacionada com outro género, pelo que parte do binómio da espécie tem de ser alterada. Um gênero pode ser fundido com outro gênero ou dividido em vários gêneros, o que requer que vários nomes de espécies sejam alterados. Grupos táxones inteiros podem ser transferidos para outras partes da árvore hierárquica como resultado do conhecimento recém-descoberto sobre ascendência comum, por exemplo, nos casos em que as características morfológicas tradicionalmente utilizadas têm de ser reconsideradas à luz da evidência molecular. Peculiaridades como homónimos (nomes idênticos para diferentes espécies) e sinónimos (vários nomes para uma espécie) somam-se às dificuldades em lidar com taxonomias. A complexidade do tratamento desses dados dinâmicos deu origem ao novo campo da computação taxonómica.

Taxonomias tradicionais muitas vezes lidam com um grupo definido de organismos, por exemplo, uma determinada família, classe ou reino, e referem-se a uma determinada região geográfica, na qual o grupo descrito é bem conhecido e documentado. Exemplos disso são as «listas de verificação taxonómicas» regionais, como a Euro + Med PlantBase (plantas vasculares da Europa e da região do Mediterrâneo) e a Fauna Europaea (animais terrestres e de água doce europeus), que são esforços conjuntos de taxonomistas de muitas instituições e estão constantemente a ser atualizados. Iniciativas como a Infraestrutura Pan-Europeia de Diretórios de Espécies (PESI) fundem taxonomias de diferentes comunidades numa lista de verificação única e completa. Existem iniciativas semelhantes a nível mundial: O Catálogo da Vida reúne dados de 168 bases de dados taxonómicos num índice oficial de espécies conhecidas de animais, plantas, fungos e microrganismos, que atualmente enumera 1,8 milhões das 1,9 milhões de espécies nomeadas do mundo. A taxonomia de base do GBIF baseia-se no Catálogo da Vida e é regularmente reunida num processo automático a partir de 56 fontes.
Escusado será dizer que a decisão sobre a lista de controlo a utilizar para uma recolha depende da cobertura taxonómica e geográfica. Taxonomias passam por atualizações constantes, de modo que a correspondência de objetos de coleta a qualquer uma das listas de verificação mencionadas deve ser realizada em intervalos regulares. A maioria deles está disponível através de serviços web que permitem uma fácil integração em infra-estruturas e produtos existentes. Listas de verificação sinónimas regionais e globais, como o PESI e o Catálogo da Vida, podem ser usadas para implementar mecanismos de expansão de consultas que estendem as consultas do utilizador para um táxon a todos os sinónimos conhecidos deste táxon. Tais funções de consulta-expansão já são de ponta em portais de biodiversidade.
Para espécimes de história natural, os identificadores de dados abertos ligados tornaram-se amplamente utilizados no passado recente, por exemplo, através da implementação dos identificadores estáveis HTTP do Consórcio de Instalações Taxonómicas Europeias (CETAF). No caso dos taxa, estão a ser debatidas iniciativas semelhantes, mas a incerteza inerente e o fluxo constante de taxonomias tornam os taxa difíceis de compreender e dificultam esses esforços.
Um problema que não pode ser resolvido utilizando taxonomias canónicas é a questão das identificações incorretas – espécimes confundidos com uma determinada espécie, o que resulta na utilização de nomes incorretos para objetos. Tal não pode ser completamente evitado, tendo em conta que algumas coleções contêm milhões de espécimes, que não podem ser atualizados constantemente. Portanto, isso deve ser levado em conta ao usar os dados.

Para o OpenUp!, nenhuma taxonomia uniforme é usada para os objetos-espécime. Uma vez que os dados são fornecidos por instituições que são especialistas nos respetivos domínios, espera-se que apliquem listas de verificação adequadas aos seus dados antes de os transmitirem ao OpenUp. No entanto, para aumentar a acessibilidade, o OpenUp! enriquece os metadados dos objetos com nomes comuns em 300 línguas e dialetos, de modo a que uma espécie possa ser encontrada (com alguma certeza) sem conhecer o seu nome científico. O enriquecimento adicional inclui ligações à literatura científica disponível na Biblioteca do Património da Biodiversidade (BHL), um consórcio dedicado a tornar a literatura herdada sobre biodiversidade acessível em linha.
Agradecimentos: Gostaria de agradecer aos meus colegas Walter Berendsohn, Petra Böttinger, Gabi Dröge, Anton Güntsch, Agnes Kirchhoff e Gerda Koch pelos seus valiosos comentários e sugestões.
Atribuições de imagens:
- Ursus thibetanus G.[Barão] Cuvier, 1823, Museumfür Naturkunde Berlim, Alemanha, CC BY-SA
- As sete principais classificações taxonómicas de uma classificação biológica, Peter Halasz, Wikimedia Commons, Public Domain.
- Testudo hermanni Gmelin, 1789, Muséum national d'Histoire naturelle, França, CC BY-NC-ND
