Chceme, aby lidé mohli vyhledávat, nalézat a používat materiály kulturního dědictví online. To je jednodušší – a pro všechny mnohem plynulejší –, pokud jsou soubory obsahu (obrázky, textové dokumenty nebo audio/video klipy) a doprovodná metadata (informace o tom, co je položka a odkud pochází) kvalitní.
Prostřednictvím strategie Europeana na období 2020–2025 budeme i nadále spolupracovat s agregátory a poskytovateli dat na investicích do zdrojů, činností a technologií – jako je strojové učení a další služby v oblasti obohacování – s cílem zlepšit naše metadata a obsah.
Zaměření na kvalitu
Prostřednictvím stávajících sítí agregátorů a s podporou členských států EU budeme pracovat na tom, abychom institucím pomohli pochopit, proč jsou dobré údaje důležité, a podpoříme je při vytváření kvalitnějšího obsahu a metadat. Vypracujeme a využijeme publikační rámec Europeany na podporu toho, jak instituce pracují s materiály, které s námi sdílejí, vytvářejí je a vylepšují.
Prostřednictvím úvodníků a kampaní Europeany budeme prezentovat vysoce kvalitní obsah a sami vytvoříme platformu, která bude klást větší důraz na naše partnerské instituce a zajistí, aby dobré výsledky byly viditelné pro všechny.
Cosmina Berta z Německé digitální knihovny a členka Výboru pro kvalitu dat Europeany říká: „Největšími výzvami pro odborníky v oblasti metadat jsou definování kvality dat a zavedení metrik kvality dat, zejména proto, že scénáře využití dat se v průběhu času mění. Doufám, že prostřednictvím této strategie dosáhneme většího konsensu ohledně definování a měření kvality údajů a vymezíme jasnější koncepci jejího provádění. Jsem velkým fanouškem standardizace a v mém ideálním světě bude standardizace hrát větší roli při definování a dosahování kvality údajů.
„Pokud definujeme cíle, kterých chceme dosáhnout – „co“ a „za jakým účelem“ – pak lze snáze nastínit, provést a standardizovat „jak“ dosáhnout těchto cílů. Agregátory jsou zde důležité. Instituce pak mohou lépe oslovit své publikum a pokročit ve svých celkových výzkumných a vzdělávacích účelech.“
Lepší propojení
Jsou-li kulturní obsah a metadata připravovány standardizovaným způsobem bez ohledu na to, která instituce je vytváří, mohou být používány v široké škále systémů a napříč nimi, nejen v rámci platformy Europeana. Instituce kulturního dědictví mohou těžit například z interoperability se sbírkami jiných institucí nebo z propojení s mezinárodními iniciativami, jako jsou Wikidata.
Používání standardních propojených datových formátů spolu se zlepšením mnohojazyčnosti povede k lepšímu propojení sbírek Europeany s jinými platformami a službami.
Henning Scholz, partner a provozní manažer nadace Europeana, říká: „Vydáním metadatové složky publikačního rámce Europeana v létě 2019 jsme učinili mnohojazyčnost nedílnou součástí našeho konceptu kvality údajů. Vyjasnění toho, v jakém jazyce jsou metadata poskytována, usnadní strojový překlad metadat a zpřístupní naše dědictví ve všech jazycích EU. Máme před sebou ještě dlouhou cestu, ale pokud se dokážeme zaměřit na označování klíčových polí metadat správným jazykem, můžeme v příštích dvou letech dosáhnout značného pokroku.“
Využití technologií - a síly lidí - k obohacení dat
Ruční zlepšování kvality metadat milionů záznamů z různých zdrojů vyžaduje obrovské množství času a zdrojů. Uplatňování nástrojů umělé inteligence a strojového učení v kombinaci s lidskými znalostmi, které poskytují odborníci v dané oblasti i crowdsourcingové kampaně (myslím EnrichEuropeana a CrowdHeritage),nabízí pozoruhodnou příležitost ke zlepšení kvality metadat.
Budeme pracovat na způsobech, jak obohatit metadata a provádět úkoly související s daty automaticky, poloautomaticky nebo pomocí síly davu.
