Bună Clemens! Ne puteți spune despre locul dvs. de muncă de zi cu zi și despre rolul dvs. în ziarele Europeana?
Clemens: Lucrez la Biblioteca de Stat din Berlin (Staatsbibliothek zu Berlin - Preußischer Kulturbesitz), unde consiliez Direcția cu privire la strategia de cercetare și, de asemenea, particip la mai multe proiecte de cercetare, în principal în domeniile recunoașterii optice a caracterelor (OCR), învățării automate și științelor umaniste digitale.
Am fost implicat în Europeana Newspapers încă de la început. Când proiectul Europeana Newspapers a primit finanțare în 2012, am lucrat la Biblioteca Națională a Țărilor de Jos și am condus procesarea OCR a 10 milioane de pagini de ziare pentru proiect. În vara anului 2014, m-am mutat la Biblioteca de Stat din Berlin pentru a coordona întregul proiect, până la sfârșitul său, în 2015. De atunci, colaborez cu Europeana pentru a pune la dispoziție rezultatele proiectului sub formă de colecție tematică.
Pentru ce și pentru cine este Europeana Newspapers?
Ziarele surprind detaliile vieții de zi cu zi din trecut - o mulțime de lucruri care nu ajung în manualele de istorie pot fi descoperite în ziarele istorice. Există un mare potențial de a avea un punct comun de acces pentru ziarele din diferite țări europene, de exemplu, pentru comparație și pentru studiul modului în care mass-media a reflectat în trecut percepțiile publice asupra unor evenimente majore, cum ar fi asasinarea lui Franz Ferdinand sau Revoluția din 1917.
Există deja o serie de proiecte de cercetare care colaborează cu Europeana Newspapers în diverse moduri, de la analiza textului la metode bazate pe imagini sau studiul indicilor istorici ai pieței bursiere. Dar ziarele sunt, de asemenea, o sursă foarte interesantă pentru programatori creativi, oameni de știință cetățeni sau genealogi sau oricine este interesat de multe detalii ale vieții din trecut.
Ziarele Europeana și-au început viața ca un proiect propriu, iar acum este o colecție tematică. Ne puteți spune câte ceva despre dezvoltarea sa?
Când am început cu proiectul Europeana Newspapers, Europeana nu a putut oferi căutare în text complet în plus față de metadatele despre obiectele de patrimoniu cultural. Astfel, un portal prototip a fost dezvoltat și deservit de Biblioteca Europeană (TEL). Din păcate, CENL, organizația care a finanțat TEL, a decis să închidă serviciul până la sfârșitul anului 2016. De atunci, colaborăm cu Europeana pentru a salva datele din ziare și caracteristicile de acces prin migrarea la principala platformă Europeana Collections.
Cu toate acestea, TEL și Europeana utilizează tehnologii diferite pentru a furniza date, astfel încât cea mai mare parte a dezvoltării a trebuit să înceapă de la zero. Întrucât ziarele necesită o funcționalitate specifică care nu era prezentă anterior în Europeana și întrucât datele sunt de un volum imens, acest lucru s-a dovedit a fi destul de dificil și consumator de timp. În plus, colecția de ziare trebuia să se integreze în prezentarea generală a obiectelor de patrimoniu cultural pe colecțiile Europeana, ceea ce a generat provocări suplimentare pentru proiectare și dezvoltare.

Să vorbim despre conținut - ai găsit ceva care te excită?
Conținutul pe care îl acoperă ziarele este atât de larg, este cu adevărat interesant să descoperiți varietatea. Puteți găsi, de exemplu, romane celebre care au apărut pentru prima dată într-o serie într-un ziar zilnic. Dar ceea ce m-a surprins cel mai mult până acum sunt anunțurile istorice. Ele sunt interesante din atât de multe unghiuri - tipografii au fost cu adevărat creativi cu tehnicile pe care le aveau la dispoziție. Produsele în sine și, în special, modul în care au fost promovate sunt adesea destul de amuzante și foarte revelatoare cu privire la tendințele și mentalitățile societăților de atunci.
Ce urmează pentru dumneavoastră și pentru Europeana Newspapers?
Avântul ziarelor istorice digitalizate este enorm și încă în creștere. Deși există o serie de proiecte internaționale de cercetare colaborativă, cum ar fi Oceanic Exchanges, impresso sau NewsEYE, există, de asemenea, de exemplu, trei grupuri de dezbatere privind utilizarea ziarelor istorice digitalizate în cercetare în cadrul conferinței internaționale privind științele umaniste digitale din acest an .
Aici, în Germania, tocmai am început un proiect de creare a unui portal comun pentru toate ziarele germane digitalizate în contextul Bibliotecii digitale germane. Și, în același timp, mult mai multe milioane de pagini vor fi digitalizate în următorii ani datorită finanțării puse la dispoziție de Fundația Germană de Cercetare (DFG). Portalul ziarului german va beneficia foarte mult de standardele și cele mai bune practici dezvoltate în cadrul Europeana Newspapers. Alte țări, cum ar fi Elveția și Luxemburg, au adoptat între timp standarde similare și au lansat noi portaluri de ziare impresionante.
Sperăm, desigur, că în viitor vom putea include mai multe dintre aceste colecții dispersate de ziare în Europeana Newspapers, lucrând în același timp la îmbunătățirea și extinderea funcționalității disponibile pentru ziare în cadrul platformei Europeana Collections.
