Seit Januar 2015 ist Europeana eine der Digital Service Infrastructures (DSI) der Europäischen Union. In der EU gibt es mehrere davon, darunter ein sichereres Internet für Kinder, elektronische Gesundheitsdienste und Unternehmensführung. Im Rahmen der Europeana DSI wird das kulturelle und wissenschaftliche Erbe Europas über die Plattform Europeana Collections präsentiert und online zugänglich gemacht, und die Einrichtungen des Kulturerbes werden bei der Anpassung an dieses digitale Zeitalter unterstützt.
Im vergangenen Jahr veröffentlichte die Europäische Kommission eine Bewertung von Europeana, in der unsere Erfolge und einige Bereiche dargelegt wurden, auf die wir uns als nächstes konzentrieren sollten. In dieser Reihe werden wir uns einige der Tätigkeiten von Europeana DSI ansehen, die in der Bewertung als Priorität betrachtet wurden, um Ihnen ein besseres Verständnis der Bemühungen und Herausforderungen zu vermitteln, an denen wir derzeit arbeiten.
Die Sprache, die Sie sprechen, sollte kein Hindernis sein, um auf Europeana Collections zu finden, was Sie wollen, aber im Moment könnte es sein. Finden Sie heraus, was wir tun, um das in Ordnung zu bringen.
Europeana Collections enthält Material aus Galerien, Bibliotheken, Archiven und Museen in allen 28 EU-Mitgliedstaaten - und mehr. Sie können auf der Website in 27 Sprachen navigieren, und es ist einfach, nach Elementen zu suchen, die in Ihrer eigenen Sprache beschrieben sind. Aber die Dinge werden komplizierter, wenn Sie Elemente sehen möchten, die Ihrer Suche entsprechen, aber in einer anderen Sprache beschrieben sind.
Insgesamt werden 37 Sprachen verwendet, um die Sammlungen zu beschreiben. Mehr als die Hälfte des gesamten Materials (57%) verwendet jedoch eine von nur fünf Sprachen - Englisch, Deutsch, Niederländisch, Norwegisch oder Französisch.
Es ist nicht einfach, ein in einer Sprache beschriebenes Element in den Ergebnissen oder verwandtem Material aufzutauchen, wenn es in einer anderen Sprache gesucht wird. Und wir wissen, dass wir noch einen langen Weg vor uns haben, aber positive Veränderungen in diesem Bereich sind eine unserer Prioritäten.
Unser Ziel
Wir möchten, dass die Menschen finden, wonach sie suchen – auch wenn sie nicht die Sprache verwenden, in der ihr Zielelement beschrieben ist.
Wir möchten die Chancen erhöhen, dass die Suche nach etwas in einer Sprache Ergebnisse liefert, die Ihren Kriterien in einer anderen Sprache entsprechen.
Herausforderungen
Die automatische Übersetzung wird immer besser, ist aber nicht narrensicher, wie Sie gesehen haben, wenn Sie jemals ein Online-Tool wie Google Translate verwendet haben. Bei Europeana Collections kommen Komplikationen hinzu. Wir konzentrieren uns nicht darauf, dass eine bestimmte Sprache in eine andere übersetzt wird. Wir arbeiten mit Sammlungen, die in 37 Sprachen beschrieben sind, und versuchen, sie mit Suchbegriffen abzugleichen, die in jeder Sprache verfügbar sein könnten. Darüber hinaus sind Metadaten keine natürliche Sprache mit vollständigen Sätzen und vorhersehbarer Grammatik; Sie wird oft in kurzen Sätzen oder sogar in einzelnen Wörtern dargestellt, was bedeutet, dass der Kontext, der für eine genaue Übersetzung erforderlich ist, schwer zu finden ist. Eine weitere Komplexitätsebene ist die Tatsache, dass die verwendeten Begriffe sehr spezifisch sein können - sie könnten wie ein allgemeiner Begriff aussehen, aber eine andere Bedeutung haben, wenn sie im Zusammenhang mit der Beschreibung von digitalem kulturellem Material verwendet werden.
Automatisierte Prozesse können nur funktionieren, wenn sie mit den richtigen und geeigneten Informationen gefüttert werden. Das klingt offensichtlich, aber wie wir in den früheren Beiträgen dieser Reihe gesehen haben, unterscheiden sich die Informationen, die Europeana zur Verfügung gestellt werden, stark in ihrer Tiefe und Qualität.
Damit etwas übersetzt werden kann, müssen wir wissen, in welcher Sprache das ursprüngliche Element bereitgestellt wird. Unsere Systeme werden nicht raten. Jedes Element (wie Titel und Beschreibung) benötigt also einen Sprachmarker. Dies ist eine weitere Informationsebene, die die Einrichtungen des Kulturerbes bereitstellen müssen.
Was wir tun
Neue Innovationen
In diesem Jahr haben wir unseren Qualitätsstandard, das Europeana Publishing Framework, überarbeitet, um neben den bestehenden Standards für Inhalte auch Standards für Metadaten aufzunehmen. Jetzt ermutigt es die Menschen, die an Metadaten arbeiten, Elemente wie Titel in mehrere Sprachen zu übersetzen und kontextähnliche Ortsnamen - die selbst mehrsprachig sind - aus kontextuellen Vokabeln aufzunehmen (siehe Punkt unten). Das Framework regt auch die Verwendung dieser wichtigen Sprach-Tags an, um zu zeigen, welche Sprache verwendet wird. Dadurch entfällt das Rätselraten und es können mehr automatische Verknüpfungs- und Übersetzungsprozesse implementiert werden.
Neben dem Know-how der Europeana Foundation und der Network Association setzen wir auf die Arbeit anderer, um die Mehrsprachigkeit der Europeana Collections zu verbessern. Im vergangenen Jahr haben wir mit dem eTranslation-Team ein Pilotprojekt durchgeführt - ein weiteres von der Europäischen Union finanziertes DSI-Projekt. Auf diesem Pilotprojekt bauen wir nun mit weiteren Experimenten auf, um das automatische Übersetzungspotenzial des Projekts für Europeana zu nutzen.
Laufende Aktivitäten
Wenn ein Satz in den richtigen Kontext gestellt wird, ist es viel einfacher, ihn zu übersetzen. Wir verwenden weiterhin Metadaten-Anreicherung, um mehr Kontext für das Material zu schaffen, das Sie auf Europeana Collections finden. Unsere Bemühungen umfassen hier die Verwendung „kontextueller Vokabulare“, insbesondere solcher, die als Linked Open Data verfügbar sind. Diese Datensätze geben uns zusätzliche Details wie mehrsprachige Etiketten, Übersetzungen von Schlüsselkonzepten oder verschiedene Varianten von Namen für Personen und Orte. Dies erleichtert es den Menschen, Artikel auf Europeana Collections zu suchen und zu finden. Vokabeln können entweder von Datenanbietern oder von Europeana im Rahmen verschiedener (halb-)automatischer Metadatenanreicherungsprozesse verwendet werden.
Europa ist mehrsprachig. Das müssen wir auch sein. Wir sind unseren Partnern und Freunden dankbar, dass sie uns dabei geholfen haben, wichtige Elemente wie den Europeana Publishing Framework und die von Europeana verwendeten Rechteerklärungen (die Informationen, die Ihnen sagen, was Sie mit einem Artikel tun können, den Sie auf Europeana finden, z. B. ist er urheberrechtlich geschützt oder gemeinfrei?) in mehr Sprachen zu übersetzen. Bisher haben die Rechteaussagen sieben Übersetzungen, sechs weitere sind unterwegs.
Die Website der Europeana Collections ist in 27 Sprachen verfügbar, und in diesem Jahr haben wir eine neue Ausstellung - Heritage at Risk - in sieben Sprachen veröffentlicht.
Worauf man achten sollte...
Die Mehrsprachigkeit von Europeana ist eine Priorität und Gegenstand einer zweitägigen Veranstaltung im Oktober unter finnischem EU-Ratsvorsitz. Auf der Veranstaltung werden sich die Europeana Foundation und das finnische Ministerium für Bildung und Kultur auf Bedürfnisse, Erwartungen und Wege zur Mehrsprachigkeit im digitalen Kulturerbe konzentrieren.
Du kannst auch helfen. Mit unseren Partnern führen wir „Transcribathon“-Veranstaltungen durch, bei denen jeder eingeladen wird (entweder zu Hause online oder bei einer physischen Veranstaltung) und die Inhalte häufig handschriftlicher Textdokumente eingegeben werden, damit sie leichter abgerufen und durchsucht und maschinell übersetzt werden können. Im vergangenen Jahr wurden fünf Transcribathons in Zusammenarbeit mit Kulturerbeinstitutionen in ganz Europa (Deutschland, Italien, Belgien, Österreich, Rumänien) organisiert und fast 3.000 Dokumente im Zusammenhang mit dem Ersten Weltkrieg transkribiert.
Erfahren Sie mehr
Erfahren Sie mehr über unsere automatischen Anreicherungen oder die eTranslation-Tätigkeit der Europäischen Union.
Und wenn Sie sich für die feinen Details des Sprachelements des Europeana Publishing Framework interessieren, können Sie auch den Europeana Publishing Guide einsehen, in dem genau beschrieben wird, was bei der Übermittlung von Daten an Europeana erforderlich ist.
EuropeanaTech hat Anstrengungen im Bereich der Mehrsprachigkeit unternommen, siehe beispielsweise die bewährten Verfahren für den mehrsprachigen Zugang und die verschiedenen Präsentationen zur Behandlung sprachlicher Fragen auf der letzten EuropeanaTech-Konferenz.
Und helfen Sie, Europeana mehrsprachig zu machen, indem Sie sich bei Transcribathon.eu anmelden. Dort finden Sie Tutorials, die Ihnen den Einstieg in Englisch, Französisch und Deutsch erleichtern, sowie Informationen zu unseren nächsten Veranstaltungen.
