Zbiory historii naturalnej w muzeach na całym świecie są repozytoriami ogromnych ilości zachowanych okazów biologicznych, które dokumentują przeszłą i obecną różnorodność biologiczną naszej planety, w tym wiele wymarłych gatunków. Zbiory te zawierają przedmioty takie jak wypchane i zamontowane zwierzęta, przypięte owady, suszone rośliny, nasiona i owoce, a także wszelkiego rodzaju skamieliny. W przeszłości większość tych okazów była dostępna tylko dla naukowców, ale dziś cyfryzacja sprawia, że są one coraz bardziej widoczne dla społeczeństwa. Wirtualne galerie obrazów i modeli 3D, a także pliki wideo i audio umożliwiają odkrywanie ukrytych skarbów składów muzealnych, które są zazwyczaj niedostępne dla stałych zwiedzających. Agregator historii naturalnej Europeany, OpenUp!, wnosi obecnie do portalu Europeana 8,7 mln obiektów z 34 instytucji. Dostarczenie tych danych opiera się na utrwalonej infrastrukturze danych w dziedzinie historii naturalnej, a mianowicie na usłudze dostępu do zbiorów biologicznych dla Europy oraz na globalnym instrumencie informacji o różnorodności biologicznej.
![Ursus thibetanus G.[Baron] Cuvier, 1823, Museumfür Naturkunde Berlin, Niemcy, CC BY-SA](/files/Images/Blog_images/2019-01/Ursusthibetanus.jpeg)
Aby znaleźć te obiekty w kolekcjach Europeany, najczęstszym punktem dostępu jest nazwa organizmu. Biolodzy używają dwumianów – nazw składających się z dwóch części, takich jak Ursus maritimus dla niedźwiedzia polarnego – do oznaczania gatunków. W przeciwieństwie do nazw zwyczajowych w różnych językach, te (łacińskie) nazwy są używane na arenie międzynarodowej. Gatunki o wspólnych cechach są pogrupowane w rodzaje, które z kolei są pogrupowane w rodziny. Definiując kilka hierarchicznych grup organizmów o wspólnych cechach i przodkach (tzw. taksony), biolodzy (taksonomiści) tworzą taksonomie. Gatunek Ursus maritimus znajdowałby się na najniższym poziomie takiej taksonomii, wraz z Ursus arctos (niedźwiedź brązowy) i Ursus thibetanus (niedźwiedź czarny azjatycki) należy do rodzaju Ursus, który z kolei należy do rodziny Ursidae; Na najwyższym poziomie byłaby Animalia jako królestwo.
Taksonomie reprezentują nasze rozumienie różnorodności biologicznej i ewolucji gatunków, które są przedmiotem stałych badań. W związku z tym taksonomie są w ciągłym przepływie. W miarę odkrywania nowych gatunków będą dodawane nowe nazwy. Systematyczne badania mogą wykazać, że dany gatunek jest bliżej spokrewniony z innym rodzajem, w związku z czym należy zmienić część dwumianowego gatunku. Rodzaj może zostać połączony z innym rodzajem lub podzielony na kilka rodzajów, co wymaga zmiany kilku nazw gatunków. Całe grupy taksonomiczne mogą zostać przeniesione do innych części drzewa hierarchicznego w wyniku nowo odkrytej wiedzy o wspólnym pochodzeniu, np. w przypadkach, gdy tradycyjnie stosowane cechy morfologiczne muszą zostać ponownie rozważone w świetle dowodów molekularnych. Szczególne cechy, takie jak homonimy (identyczne nazwy dla różnych gatunków) i synonimy (kilka nazw dla jednego gatunku), przyczyniają się do trudności w radzeniu sobie z taksonomią. Złożoność przetwarzania takich dynamicznych danych doprowadziła do powstania nowej dziedziny obliczeń taksonomicznych.

Tradycyjne taksonomie często dotyczą określonej grupy organizmów, np. określonej rodziny, klasy lub królestwa, i odnoszą się do określonego regionu geograficznego, w którym opisana grupa jest dobrze znana i udokumentowana. Przykładami są regionalne „listy kontrolne taksonomiczne”, takie jak Euro + Med PlantBase (rośliny naczyniowe w Europie i regionie Morza Śródziemnego) oraz Fauna Europaea (europejskie zwierzęta lądowe i słodkowodne), które są wspólnymi wysiłkami taksonomistów z wielu instytucji i są stale aktualizowane. Inicjatywy takie jak ogólnoeuropejska infrastruktura katalogów gatunków (PESI) łączą taksonomie z różnych społeczności w jedną listę kontrolną obejmującą wszystkie taksony. Podobne inicjatywy istnieją na szczeblu globalnym: Katalog Życia łączy dane ze 168 baz taksonomicznych w autorytatywny indeks znanych gatunków zwierząt, roślin, grzybów i mikroorganizmów, który obecnie wymienia 1,8 miliona z 1,9 miliona nazwanych gatunków na świecie. Taksonomia szkieletowa GBIF opiera się na katalogu życia i jest regularnie montowana w automatycznym procesie z 56 źródeł.
Nie trzeba dodawać, że decyzja o tym, którą listę kontrolną należy wykorzystać do gromadzenia danych, zależy od zasięgu taksonomicznego i geograficznego. Taksonomie podlegają ciągłym aktualizacjom, dlatego dopasowywanie obiektów kolekcji do którejkolwiek z wymienionych list kontrolnych powinno odbywać się w regularnych odstępach czasu. Większość z nich jest dostępna za pośrednictwem usług internetowych, które umożliwiają łatwą integrację z istniejącą infrastrukturą i produktami. Regionalne i globalne synonimizowane listy kontrolne, takie jak PESI i Catalogue of Life, mogą być wykorzystywane do wdrażania mechanizmów rozszerzania zapytań, które rozszerzają zapytania użytkowników o takson na wszystkie znane synonimy tego taksonu. Takie funkcje rozszerzania zapytań są już najnowocześniejszymi funkcjami na portalach dotyczących różnorodności biologicznej.
W przypadku próbek historii naturalnej identyfikatory połączonych otwartych danych stały się szeroko stosowane w niedawnej przeszłości, na przykład poprzez wdrożenie stabilnych identyfikatorów HTTP Konsorcjum Europejskich Obiektów Taksonomicznych (CETAF). W przypadku taksonów omawiane są podobne inicjatywy, ale nieodłączna niepewność i stały przepływ taksonomii sprawiają, że taksony nie są łatwe do zrozumienia i utrudniają takie wysiłki.
Problemem, którego nie można rozwiązać za pomocą taksonomii kanonicznych, jest kwestia błędnej identyfikacji – okazów pomylonych z określonym gatunkiem, co skutkuje stosowaniem nieprawidłowych nazw obiektów. Nie można tego całkowicie uniknąć, biorąc pod uwagę, że niektóre kolekcje zawierają miliony okazów, których nie można stale aktualizować. Należy to wziąć pod uwagę przy korzystaniu z danych.

W przypadku OpenUp! nie stosuje się jednolitej taksonomii dla obiektów okazowych. Ponieważ dane są dostarczane przez instytucje, które są ekspertami w swoich dziedzinach, oczekuje się, że przed przekazaniem ich do OpenUp zastosują odpowiednie listy kontrolne dotyczące swoich danych. Aby jednak zwiększyć dostępność, OpenUp! wzbogaca metadane obiektów o nazwy zwyczajowe w 300 językach i dialektach, dzięki czemu gatunek można znaleźć (z pewną pewnością) bez znajomości jego nazwy naukowej. Dalsze wzbogacanie obejmuje linki do literatury naukowej dostępnej w bibliotece dziedzictwa różnorodności biologicznej (BHL), konsorcjum zajmującym się udostępnianiem w internecie dotychczasowej literatury na temat różnorodności biologicznej.
Podziękowania: Chciałbym podziękować moim kolegom Walterowi Berendsohnowi, Petrze Böttinger, Gabi Dröge, Antonowi Güntschowi, Agnes Kirchhoff i Gerdzie Koch za ich cenne uwagi i sugestie.
Przypisy obrazów:
- Ursus thibetanus G.[Baron] Cuvier, 1823, Museumfür Naturkunde Berlin, Niemcy, CC BY-SA
- Siedmiu głównych stopni taksonomicznych klasyfikacji biologicznej, Peter Halasz, Wikimedia Commons, Domena publiczna.
- Testudo hermanni Gmelin, 1789, Muséum national d'Histoire naturelle, Francja, CC BY-NC-ND
