Începând din ianuarie 2015, Europeana este una dintre infrastructurile de servicii digitale (ISD) ale Uniunii Europene. Printre acestea se numără un internet mai sigur pentru copii, servicii electronice de sănătate și gestionarea întreprinderilor. ISD Europeana prezintă și oferă acces online la patrimoniul cultural și științific al Europei prin intermediul platformei Europeana Collections și sprijină instituțiile de patrimoniu cultural pe măsură ce se adaptează la această eră digitală.
Anul trecut, Comisia Europeană a publicat o evaluare a Europeana, care a subliniat realizările noastre și unele domenii asupra cărora trebuie să ne concentrăm în continuare. În această serie, vom analiza unele dintre activitățile ISD Europeana pe care evaluarea le-a considerat o prioritate, oferindu-vă o mai bună înțelegere a eforturilor și a provocărilor la care lucrăm în prezent.
Limba pe care o vorbiți nu ar trebui să fie o barieră în calea găsirii a ceea ce vă doriți în colecțiile Europeana, dar chiar acum ar putea fi. Aflați ce facem pentru a îndrepta această situație.
Colecțiile Europeana conțin materiale din galerii, biblioteci, arhive și muzee din toate cele 28 de țări membre ale UE - și multe altele. Puteți naviga pe site în 27 de limbi și este ușor să căutați elementele descrise în limba dumneavoastră. Dar lucrurile devin mai complicate atunci când doriți să vedeți elemente care se potrivesc căutării dvs., dar sunt descrise într-o altă limbă.
În total, 37 de limbi sunt folosite pentru a descrie colecțiile. Cu toate acestea, mai mult de jumătate din întregul material (57%) utilizează una dintre cele cinci limbi - engleza, germana, olandeza, norvegiana sau franceza.
Efectuarea unui element descris într-o limbă să apară în rezultate sau materiale conexe atunci când sunt căutate într-o altă limbă nu este ușor. Și știm că avem un drum lung de parcurs, dar a face schimbări pozitive în acest domeniu este una dintre prioritățile noastre.
Obiectivul nostru
Dorim ca oamenii să găsească ceea ce caută – chiar dacă nu utilizează limba în care este descris elementul lor țintă.
Dorim să creștem șansele ca, atunci când căutați ceva într-o limbă, să obțineți rezultate care să corespundă criteriilor dvs. într-o altă limbă.
Provocări
Traducerea automată devine din ce în ce mai bună, dar nu este infailibilă, așa cum ați văzut dacă ați utilizat vreodată un instrument online precum Google Translate. În cazul colecțiilor Europeana, există complicații suplimentare. Nu ne concentrăm pe traducerea unei anumite limbi în alta. Lucrăm cu colecții descrise în 37 de limbi și încercăm să le corelăm cu termeni de căutare care ar putea apărea în orice limbă. În plus, metadatele nu sunt ca un limbaj natural, cu propoziții complete și o gramatică previzibilă; este adesea prezentat în fraze scurte sau chiar în cuvinte unice, ceea ce înseamnă că contextul necesar pentru o traducere exactă este greu de găsit. Adăugarea unui alt nivel de complexitate este faptul că termenii utilizați pot fi foarte specifici - ar putea arăta ca un termen comun, dar au un înțeles diferit atunci când sunt utilizați în contextul descrierii materialului cultural digital.
Procesele automatizate pot funcționa numai atunci când sunt alimentate cu informații corecte și adecvate. Acest lucru pare evident, dar, după cum am văzut în postările anterioare din această serie, informațiile furnizate Europeana variază foarte mult în ceea ce privește profunzimea și calitatea sa.
Pentru ca orice lucru să fie tradus, trebuie să știm în ce limbă este furnizat elementul original. Sistemele noastre nu vor ghici. Deci, fiecare element (cum ar fi titlul și descrierea) are nevoie de un marcator de limbă. Acesta este un alt nivel de informații pe care instituțiile de patrimoniu cultural trebuie să le furnizeze.
Ce facem
Noi inovații
În acest an, am revizuit standardul nostru de calitate, Europeana Publishing Framework, pentru a include standarde pentru metadate, pe lângă standardele existente pentru conținut. Acum, încurajează persoanele care lucrează la metadate să traducă elemente precum titluri în mai multe limbi și să includă contexte precum nume de locuri - care sunt ele însele multilingve - din vocabulare contextuale (a se vedea elementul de mai jos). Cadrul încurajează, de asemenea, utilizarea acestor etichete lingvistice extrem de importante pentru a arăta ce limbă este utilizată. Acest lucru elimină presupunerile și înseamnă că pot fi puse în aplicare mai multe procese automate de conectare și traducere.
Pe lângă utilizarea expertizei din cadrul Fundației și Asociației Rețelei Europeana, ne bazăm pe activitatea altora pentru a îmbunătăți multilingvismul colecțiilor Europeana. În ultimul an, am desfășurat un proiect-pilot împreună cu echipa eTranslation - un alt proiect DSI finanțat de Uniunea Europeană. În prezent, ne bazăm pe acest proiect-pilot cu activități de experimentare suplimentare pentru a profita de potențialul de traducere automată al proiectului pentru Europeana.
Activități în curs
Atunci când unei fraze i se oferă contextul potrivit, este mult mai ușor să o traducă. Continuăm să folosim îmbogățirea metadatelor pentru a oferi mai mult context materialului pe care îl găsiți pe Europeana Collections. Eforturile noastre în acest sens includ utilizarea „vocabularelor contextuale”, în special a celor disponibile sub formă de date deschise conectate. Aceste seturi de date ne oferă detalii suplimentare, cum ar fi etichete multilingve, traduceri ale conceptelor-cheie sau diferite variante de nume pentru persoane și locuri. Acest lucru facilitează căutarea și găsirea de articole în colecțiile Europeana. Vocabularele pot fi utilizate fie de furnizorii de date, fie de Europeana ca parte a diferitelor procese (semi)automate de îmbogățire a metadatelor.
Europa este multilingvă. Și noi trebuie să fim. Mulțumim partenerilor și prietenilor noștri pentru că ne-au ajutat să traducem în mai multe limbi elemente importante, cum ar fi Cadrul de publicare Europeana și declarațiile privind drepturile pe care le utilizează Europeana (informațiile care vă spun ce puteți face cu un articol pe care îl găsiți pe Europeana, de exemplu, drepturile de autor sau domeniul public?). Până în prezent, declarațiile privind drepturile au șapte traduceri, alte șase fiind pe drum.
Site-ul Europeana Collections este disponibil în 27 de limbi, iar anul acesta am lansat o nouă expoziție - Heritage at Risk - în șapte limbi.
La ce să fii atent...
Sporirea multilingvismului în Europeana este o prioritate și face obiectul unui eveniment de două zile care va avea loc în luna octombrie a acestui an, sub președinția finlandeză a Consiliului UE. În cadrul evenimentului, Fundația Europeana și Ministerul Educației și Culturii din Finlanda se vor concentra asupra nevoilor, așteptărilor și căilor de urmat în ceea ce privește multilingvismul în patrimoniul cultural digital.
Poți să ajuți și tu. Împreună cu partenerii noștri, organizăm evenimente „Transcribathon” care invită pe oricine să se alăture (fie acasă, online, fie la un eveniment fizic) și tastam conținutul documentelor text adesea scrise de mână, astfel încât acestea să poată fi accesate și căutate mai ușor și să poată fi traduse automat. În ultimul an, cinci transcribatonuri au fost organizate în cooperare cu instituții de patrimoniu din întreaga Europă (Germania, Italia, Belgia, Austria, România) și aproape 3.000 de documente legate de Primul Război Mondial au fost transcrise.
Aflați mai multe
Aflați mai multe despre îmbogățirile noastre automate sau despre activitatea eTranslation a Uniunii Europene.
Și dacă sunteți interesat de detaliile fine ale elementului lingvistic al Cadrului de publicare Europeana, puteți consulta, de asemenea, Ghidul de publicare Europeana, care detaliază exact ceea ce este necesar atunci când se transmit date către Europeana.
EuropeanaTech a depus eforturi în domeniul multilingvismului, a se vedea, de exemplu, cele mai bune practici pentru accesul multilingv și diferitele prezentări privind abordarea problemelor lingvistice din cadrul ultimei conferințe EuropeanaTech.
Ajutați-vă să faceți Europeana mai multilingvă, participând la Transcribathon.eu. Acolo veți găsi tutoriale pentru a vă ajuta să începeți în limbile engleză, franceză și germană, precum și informații despre următoarele noastre evenimente.
