Polifonia, тригодишен проект по „Хоризонт 2020“, ръководен от Университета в Болоня, събра експерти от областта на музикознанието, компютърните науки и цифровите хуманитарни науки. Тя имаше за цел да насърчи интердисциплинарните изследвания, да насърчи запазването и изследването на разнообразните музикални традиции на Европа и да отключи и свърже разпръснатите знания за музикалното наследство. Polifonia създаде 10 пилотни проекта, насочени към нови инструменти, набори от данни, онтологии, графики на знанията и софтуер.
Нови стъпки в музикалната сфера със свързани отворени данни
Едно от ключовите усилия беше изграждането на графика на знанието (графично структурирана база данни, използвана за представяне и работа с данни) и уебпортала Polifonia.
Графиката на знанието събира няколко музикални източника и 10 големи набора от данни, за да се даде възможност за извличане на информация от кръстосани набори от данни за музикални знания. 10-те набора от данни обхващат музиката от началото на 1500-те години до наши дни и се предоставят от заинтересовани страни и партньори (като Холандския институт за звук и амп; концертната колекция на Vision), съществуващи колекции (включително позоваване на Europeana Sounds, предлагани в каталога на MusoW) или публично достъпни данни като Wikidata. Свързани са и наборите от данни на пилотите MEETUPS, TUNES, BELLS, ORGANS и MUSICBO.
В графиката на знанията за Полифония се използват свързани свободно достъпни данни. Това означава, че всяка единица в графиката, като музикално произведение или композитор, има свой уникален идентификатор. Отношенията между тези субекти се определят с помощта на машинночетими „тройки“, които могат да се използват за изграждане на усъвършенствани приложения, основани на знания. Тройната връзка свързва описаната същност (субекта) с друга същност или проста стойност на данните (обект), с определен тип връзка. Например информацията „Mozart composed the Moonlight Sonata“ („Моцарт е съставил сонатата на лунната светлина“) ще бъде представена чрез тройка с като субект идентификатор за Моцарт, като обект идентификатор за сонатата на лунната светлина и „композиран“ като свойство. Публикуването на такива тройки без ограничения за достъп води до свързани отворени данни.
Основно предизвикателство при изготвянето на свързани свободно достъпни данни са разликите в метаданните между източниците. За да се изготви графиката на познанието за Полифония, съответните свойства във всеки източник бяха картографирани в онтологията MusicMeta. Това е модел на данни, специално разработен, за да отговори на нуждите на потребителите на Polifonia, както е определено в потребителските истории, изградени след задълбочени изследвания и консултации с потребители с музиколози и общи потребители. Това дава възможност да се намерят, например, всички музикални заглавия заедно с техните композитори. В много източници идентификаторите са съотнесени към съществуващи публични списъци с идентификатори, като например Уикиданни, което улеснява намирането на информация за тази единица.
Инженерите на Polifonia използват инструменти като SPARQL Anything, разработени от партньорите на Polifonia, за да преобразуват данни от източниците в свързани данни, които са предоставени чрез крайни точки на SPARQL. Уеб порталът Polifonia има достъп до тези крайни точки за търсене на данните, като представя комбинираните резултати на потребителите и им позволява безпроблемно да преминават между данни от различни източници.
Уеб порталът Polifonia предоставя пет специализирани раздела за търсене, всеки от които съответства на предпочитаните от потребителите точки за достъп, както е видно от специализирани проучвания на потребителите. Този подход дава възможност за ефективно търсене и проучване на музикалното наследство и се поддържа от предложения за автоматично попълване и опции за филтриране, за да се усъвършенства изследването. Чрез хармонизиране на информацията от различни източници порталът разкрива скрити връзки и разкази в музикалния пейзаж. Потребителското изживяване на портала е предназначено да благоприятства случайни открития, а не предварително определени пътища.
Стойността на воденото от заинтересованите страни развитие в сектора на културното наследство
Въпреки че основната аудитория на работата по проекта са академичните среди, ние се опитахме да включим по-широка аудитория, включително публични институции, културно наследство, образование и промишленост, за да гарантираме, че продуктите отговарят на изискванията на потребителите и на продължителността на живота.
В рамките на проекта също така беше проучено как научните изследвания, свързани с културното наследство, биха могли да помогнат за решаване на проблемите на търговските и промишлените партньори, които обикновено може да не обмислят да се включат в такива инициативи. Този обмен между изследователите и заинтересованите страни предложи ценно кръстосано опрашване и предостави информация и от двете страни. Например изследователите на Polifonia проучиха как собствената онтология на Polifonia, MusicMeta, би могла да се справи с предизвикателствата за извличане на информация за заинтересованата страна Deezer и потенциално би могла да направи това за други дружества за стрийминг на музика. В бъдеще ще става все по-възможно да се създават оперативно съвместими графики за музикални знания от (мащабни и шумни) данни от музикалната индустрия.
Включването на заинтересованите страни означава също така, че разработените продукти са били вградени в инфраструктурата на заинтересованите страни от самото начало, както се случи с базата данни ORGANS в случая на Нидерландския институт за органно изкуство и с базата данни BELLS в случая на италианското Министерство на културата. Инструменти, разработени за музикален анализ (TONALITIES, FACETS) или възприемане на музика, като например хаптични устройства (ACCESS), също са били използвани от ранните осиновители в образованието.
Екосистемата Polifonia с отворен код
Polifonia следва принципите на софтуера с отворен код и FAIR (findability, accessibility, interoperability, and reusability). Всички софтуерни компоненти, разработени от Polifonia, могат да се използват повторно както във връзка, така и изолирано.
Разработката на софтуер се осъществява с помощта на платформата GitHub, която позволява споделяне на софтуер при прозрачно проследяване на промените и версиите. Това даде възможност за създаването на т.нар. „екосистемаПолифония“със съответните компоненти на изследователския процес (данни, инструменти и доклади), документирани в хранилищата на GitHub. В правилник се определя как да се създадат тези хранилища, така че в крайна сметка информацията за компонентите да може да бъде събрана и потребителите да могат да се ориентират в компонентите и техните зависимости благодарение на екосистемата Polifonia. Ядрото е readme.md файл, който съдържа всички необходими анотации. С регистрирането на GitHub хранилището в Zenodo се изпълняват автоматични версии на стабилни версии на Zenodo.
Научете повече
Интересувате ли се да научите повече за Полифония? Посетете уебсайта на Polifonia и гледайте видео уроците, за да започнете с инструментите. Можете също така да гледате уебинар за този проект, проведен по-рано този месец с подкрепата на EuropeanaTech, и да се присъедините към Общността сега!
