Dal gennaio 2015 Europeana è una delle infrastrutture di servizi digitali (DSI) dell'Unione europea. L'UE ne ha molti, altri includono Internet più sicuro per i bambini, servizi sanitari elettronici e gestione delle imprese. Europeana DSI mette in mostra e fornisce accesso online al patrimonio culturale e scientifico europeo attraverso la piattaforma Europeana Collections e sostiene gli istituti di tutela del patrimonio culturale che si adattano a questa era digitale.
L'anno scorso la Commissione europea ha pubblicato una valutazione di Europeana, che ha delineato i nostri risultati e alcuni settori su cui concentrarci in seguito. In questa serie esamineremo alcune delle attività di Europeana DSI che la valutazione ha considerato prioritarie, offrendovi una migliore comprensione degli sforzi e delle sfide su cui stiamo lavorando in questo momento.
La lingua che parli non dovrebbe ostacolare la ricerca di ciò che desideri su Europeana Collections, ma in questo momento potrebbe esserlo. Scopri cosa stiamo facendo per rimediare.
Europeana Collections contiene materiale proveniente da gallerie, biblioteche, archivi e musei di tutti i 28 paesi membri dell'UE e altro ancora. Puoi navigare sul sito web in 27 lingue ed è facile cercare gli elementi descritti nella tua lingua. Ma le cose si complicano quando vuoi vedere elementi che corrispondono alla tua ricerca ma sono descritti in una lingua diversa.
In totale, 37 lingue sono utilizzate per descrivere le collezioni. Tuttavia, più della metà di tutto il materiale (57%) utilizza una delle sole cinque lingue: inglese, tedesco, olandese, norvegese o francese.
Fare in modo che un elemento descritto in una lingua compaia nei risultati o nel materiale correlato quando viene cercato in un'altra lingua non è facile. E sappiamo di avere molta strada da fare, ma apportare cambiamenti positivi in questo settore è una delle nostre priorità.
Il nostro obiettivo
Vogliamo che le persone trovino ciò che stanno cercando, anche se non utilizzano la lingua in cui è descritto il loro oggetto di destinazione.
Vogliamo aumentare le possibilità che la ricerca di qualcosa in una lingua porti a risultati che corrispondono ai tuoi criteri in un'altra lingua.
Sfide
La traduzione automatica sta migliorando, ma non è infallibile, come avrai visto se hai mai utilizzato uno strumento online come Google Translate. Nel caso di Europeana Collections, ci sono ulteriori complicazioni. Non ci stiamo concentrando su una lingua specifica tradotta in un'altra. Stiamo lavorando con collezioni descritte in 37 lingue e cercando di abbinarle a termini di ricerca che potrebbero essere disponibili in qualsiasi lingua. Inoltre, i metadati non sono come il linguaggio naturale con frasi complete e grammatica prevedibile; è spesso presentato in frasi brevi o anche in singole parole, il che significa che il contesto necessario per una traduzione accurata è difficile da trovare. Aggiungendo un altro livello di complessità è il fatto che i termini utilizzati possono essere molto specifici - potrebbero sembrare un termine comune ma avere un significato diverso quando utilizzati nel contesto della descrizione del materiale culturale digitale.
I processi automatizzati possono funzionare solo quando vengono alimentati con le informazioni corrette e appropriate. Sembra ovvio, ma come abbiamo visto nei precedenti post di questa serie, le informazioni fornite a Europeana variano notevolmente in termini di profondità e qualità.
Affinché qualsiasi cosa possa essere tradotta, dobbiamo sapere in quale lingua è fornito l'elemento originale. I nostri sistemi non indovineranno. Quindi ogni elemento (come il titolo e la descrizione) ha bisogno di un marcatore di lingua. Questo è un altro livello di informazioni che gli istituti di tutela del patrimonio culturale devono fornire.
Cosa stiamo facendo
Nuove innovazioni
Quest'anno, abbiamo rivisto il nostro standard di qualità, Europeana Publishing Framework, per includere standard per i metadati in aggiunta agli standard esistenti per i contenuti. Ora, incoraggia le persone che lavorano sui metadati a tradurre elementi come i titoli in più lingue e a includere contesti come i toponimi - che sono a loro volta multilingue - da vocabolari contestuali (vedi voce sotto). Il Framework incoraggia anche l'uso di questi importantissimi tag linguistici per mostrare quale lingua viene utilizzata. Ciò elimina le congetture e significa che è possibile implementare processi di collegamento e traduzione più automatici.
Oltre a utilizzare le competenze della Fondazione Europeana e dell'Associazione Network, ci affidiamo al lavoro di altri per migliorare il multilinguismo delle Collezioni Europeana. L'anno scorso abbiamo realizzato un progetto pilota con il team di eTranslation, un altro progetto DSI finanziato dall'Unione europea. Stiamo ora sviluppando tale progetto pilota con ulteriori attività di sperimentazione al fine di sfruttare il potenziale di traduzione automatica del progetto per Europeana.
Attività in corso
Quando a una frase viene dato il giusto contesto, è molto più facile tradurla. Continuiamo a utilizzare l'arricchimento dei metadati per fornire più contesto per il materiale che trovi su Europeana Collections. I nostri sforzi includono l'uso di "vocabolari contestuali", in particolare quelli disponibili come Linked Open Data. Questi set di dati ci forniscono ulteriori dettagli come etichette multilingue, traduzioni di concetti chiave o diverse varianti di nomi per persone e luoghi. In questo modo è più facile per le persone cercare e trovare articoli su Europeana Collections. I vocabolari possono essere utilizzati dai fornitori di dati o da Europeana nell'ambito di vari processi (semi)automatici di arricchimento dei metadati.
L'Europa è multilingue. Dobbiamo esserlo anche noi. Siamo grati ai nostri partner e amici per averci aiutato a tradurre in più lingue elementi importanti come il quadro editoriale di Europeana e le dichiarazioni dei diritti utilizzate da Europeana (le informazioni che ti dicono cosa puoi fare con un articolo che trovi su Europeana, ad esempio se è di diritto d'autore o di pubblico dominio?). Finora, le dichiarazioni dei diritti hanno sette traduzioni con altre sei in arrivo.
Il sito web di Europeana Collections è disponibile in 27 lingue e quest'anno abbiamo pubblicato una nuova mostra - Heritage at Risk - in sette lingue.
Cosa cercare...
Rendere Europeana più multilingue è una priorità e il tema di un evento di due giorni che si terrà in ottobre sotto la presidenza finlandese del Consiglio dell'UE. L'evento vedrà la Fondazione Europeana e il Ministero finlandese dell'Istruzione e della Cultura concentrarsi sulle esigenze, le aspettative e le vie da seguire per il multilinguismo nel patrimonio culturale digitale.
Puoi aiutare anche tu. Con i nostri partner, organizziamo eventi "Transcribathon" che invitano chiunque a partecipare (a casa online o a un evento fisico) e digitano il contenuto di documenti di testo spesso scritti a mano in modo che possano essere più facilmente consultati e cercati e possano essere tradotti meccanicamente. Nell'ultimo anno sono stati organizzati cinque trascribathon in collaborazione con le istituzioni del patrimonio culturale di tutta Europa (Germania, Italia, Belgio, Austria, Romania) e sono stati trascritti quasi 3.000 documenti relativi alla prima guerra mondiale.
Scopri di più
Per saperne di più sui nostri arricchimenti automatici o sull'attività di eTranslation dell'Unione europea.
E se sei interessato ai dettagli precisi dell'elemento linguistico del quadro editoriale di Europeana, puoi anche consultare la guida editoriale di Europeana, che specifica esattamente ciò che è necessario per la trasmissione dei dati a Europeana.
EuropeanaTech ha compiuto sforzi nel settore del multilinguismo, cfr. ad esempio le migliori pratiche per l'accesso multilingue e le varie presentazioni sull'affrontare le questioni linguistiche in occasione dell'ultima conferenza EuropeanaTech.
E contribuire a rendere Europeana più multilingue partecipando a Transcribathon.eu. Qui troverai tutorial per aiutarti a iniziare in inglese, francese e tedesco e informazioni sui nostri prossimi eventi.
