Desde janeiro de 2015, a Europeana é uma das Infraestruturas de Serviços Digitais (ISD) da União Europeia. A UE tem vários deles, outros incluem uma Internet mais segura para as crianças, serviços de saúde eletrónicos e gestão empresarial. A Europeana DSI apresenta e proporciona acesso em linha ao património cultural e científico da Europa através da plataforma Europeana Collections e apoia as instituições responsáveis pelo património cultural à medida que se adaptam a esta era digital.
No ano passado, a Comissão Europeia publicou uma avaliação da Europeana, que delineou as nossas realizações e alguns domínios em que nos devemos concentrar. Nesta série, analisaremos algumas das atividades da Europeana DSI que a avaliação considerou prioritárias, dando-lhe uma maior compreensão dos esforços e desafios em que estamos a trabalhar neste momento.
A língua que fala não deve ser um obstáculo para encontrar o que pretende nas coleções Europeana, mas, neste momento, pode ser. Descubra o que estamos a fazer para corrigir esta situação.
Europeana Collections contém material de galerias, bibliotecas, arquivos e museus em todos os 28 países membros da UE - e muito mais. Pode navegar no sítio Web em 27 línguas e é fácil procurar os elementos descritos na sua própria língua. Mas as coisas tornam-se mais complicadas quando pretende ver itens que correspondem à sua pesquisa, mas que são descritos num idioma diferente.
No total, são utilizadas 37 línguas para descrever as coleções. No entanto, mais da metade de todo o material (57%) usa uma das cinco línguas - inglês, alemão, holandês, norueguês ou francês.
Fazer com que um item descrito numa língua apareça nos resultados ou material relacionado quando procurado noutra língua não é fácil. E sabemos que temos um longo caminho a percorrer, mas fazer mudanças positivas nesta área é uma das nossas prioridades.
O nosso objetivo
Queremos que as pessoas encontrem o que procuram, mesmo que não estejam a utilizar a língua em que o seu elemento-alvo está descrito.
Queremos aumentar as possibilidades de que a procura de algo numa língua produza resultados que correspondam aos seus critérios noutra língua.
Desafios
A tradução automática está a melhorar, mas não é infalível, como terá visto se alguma vez utilizou uma ferramenta em linha como o Google Tradutor. No caso da Europeana Collections, há complicações adicionais. Não nos estamos a concentrar numa língua específica a ser traduzida para outra. Estamos a trabalhar com coleções descritas em 37 línguas e a tentar combiná-las com termos de pesquisa que possam surgir em qualquer língua. Além disso, os metadados não são como uma linguagem natural com frases completas e gramática previsível; é frequentemente apresentado em frases curtas ou mesmo em palavras simples, o que significa que é difícil encontrar o contexto necessário para uma tradução exata. Acrescentar outra camada de complexidade é o facto de os termos utilizados poderem ser muito específicos - podem parecer um termo comum, mas ter um significado diferente quando utilizados no contexto da descrição de material cultural digital.
Os processos automatizados só podem funcionar quando são alimentados com as informações corretas e adequadas. Isso parece óbvio, mas, como vimos nos posts anteriores desta série, as informações fornecidas à Europeana variam muito em termos de profundidade e qualidade.
Para que qualquer coisa seja traduzida, precisamos saber em que língua o elemento original é fornecido. Os nossos sistemas não vão adivinhar. Portanto, cada elemento (como o título e a descrição) precisa de um marcador de linguagem. Trata-se de outro nível de informação que as instituições responsáveis pelo património cultural têm de fornecer.
O que estamos a fazer
Novas inovações
Este ano, revimos a nossa norma de qualidade, a Europeana Publishing Framework, para incluir normas para metadados, além das normas existentes para conteúdos. Agora, incentiva as pessoas que trabalham com metadados a traduzir elementos como títulos em várias línguas e a incluir nomes de lugares - que são multilingues - a partir de vocabulários contextuais (ver item abaixo). O quadro incentiva igualmente a utilização das etiquetas linguísticas mais importantes para mostrar qual a língua que está a ser utilizada. Isto elimina as conjecturas e significa que processos de ligação e tradução mais automáticos podem ser implementados.
Para além de utilizarmos os conhecimentos especializados da Fundação Europeana e da Associação de Redes, contamos com o trabalho de terceiros para melhorar o multilinguismo nas Coleções Europeana. No ano passado, realizámos um projeto-piloto com a equipa eTranslation - outro projeto DSI financiado pela União Europeia. Estamos agora a tirar partido desse projeto-piloto com novas atividades de experimentação, com vista a tirar partido do potencial de tradução automática do projeto para a Europeana.
Atividades em curso
Quando se dá a uma frase o contexto certo, é muito mais fácil traduzi-la. Continuamos a utilizar o enriquecimento de metadados para fornecer mais contexto para o material que encontra nas Coleções Europeana. Os nossos esforços neste domínio incluem a utilização de «vocabulários contextuais», especialmente os disponíveis sob a forma de dados abertos interligados. Estes conjuntos de dados dão-nos detalhes adicionais, como rótulos multilingues, traduções de conceitos-chave ou diferentes variantes de nomes para pessoas e lugares. Deste modo, é mais fácil para as pessoas procurarem e encontrarem artigos nas Coleções Europeana. Os vocabulários podem ser utilizados pelos fornecedores de dados ou pela Europeana no âmbito de vários processos (semi)automáticos de enriquecimento de metadados.
A Europa é multilingue. Também temos de ser. Agradecemos aos nossos parceiros e amigos por nos ajudarem a traduzir elementos importantes, como o Quadro de Publicação da Europeana e as declarações de direitos que a Europeana utiliza (as informações que lhe dizem o que pode fazer com um artigo que encontra na Europeana, por exemplo, são do domínio público ou dos direitos de autor?) para mais línguas. Até agora, as declarações de direitos têm sete traduções com mais seis a caminho.
O sítio Web Europeana Collections está disponível em 27 línguas e, este ano, lançámos uma nova exposição - Heritage at Risk - em sete línguas.
O que procurar...
Tornar a Europeana mais multilingue é uma prioridade e o tema de um evento de dois dias em outubro, sob a Presidência finlandesa do Conselho da UE. No evento, a Fundação Europeana e o Ministério da Educação e Cultura finlandês centrar-se-ão nas necessidades, expectativas e vias a seguir para o multilinguismo no património cultural digital.
Também podes ajudar. Com os nossos parceiros, organizamos eventos «Transcribathon» que convidam qualquer pessoa a participar (em casa, em linha, ou num evento físico) e a escrever o conteúdo de documentos de texto frequentemente manuscritos, para que possam ser mais facilmente consultados e pesquisados e para que possam ser traduzidos automaticamente. No último ano, foram organizados cinco transcribathons em cooperação com instituições responsáveis pelo património em toda a Europa (Alemanha, Itália, Bélgica, Áustria, Roménia) e foram transcritos quase 3 000 documentos relacionados com a Primeira Guerra Mundial.
Mais informações
Saiba mais sobre os nossos enriquecimentos automáticos ou sobre a atividade eTranslation da União Europeia.
Se estiver interessado nos pormenores pormenorizados do elemento linguístico do Quadro de Publicação da Europeana, pode também consultar o Guia de Publicação da Europeana, que especifica exatamente o que é necessário para apresentar dados à Europeana.
A EuropeanaTech desenvolveu esforços no domínio do multilinguismo; ver, por exemplo, as Melhores Práticas para o Acesso Multilingue e as várias apresentações sobre questões linguísticas na última conferência EuropeanaTech.
E ajudar a tornar a Europeana mais multilingue, participando em Transcribathon.eu. Lá encontrará tutoriais para o ajudar a começar em inglês, francês e alemão, bem como informações sobre os nossos próximos eventos.
