I quotidiani sbarcano sulla biblioteca digitale europea. Europeana ha infatti annunciato l’avvio del progetto “Europeana Newspaper” per la digitalizzazione di oltre 18 milioni di pagine di quotidiani da rendere disponibili attraverso il portale del progetto, già punto d’accesso a milioni di risorse digitalizzate tra libri, disegni, film, opere d’arte da tutta l’Europa.
Ciascuna biblioteca europea partecipante al progetto distribuirà i quotidiani digitalizzati attraverso il portale della e-library europea, con l’integrazione di un’interfaccia speciale che consentirà la ricerca di singole parole o frasi nel testo del quotidiano, andando così in direzione dei discovery tool.
Il progetto, a cui partecipano 17 editori, è coordinato dalla Bibilioteca di Stato tedesca.
Il progetto intende anche affrontare le sfide legate alla digitalizzazione dei testi come l’Ocr (Optical Character Recognition), l’Olr (Optical Layout Recognition che serve a separare più articoli presenti in una pagina), la segmentazione degli articoli e il riconoscimento delle pagine, oltre al riconoscimento dei nomi delle entità (Ner) per classificarli secondo nomi standard di persone, luoghi, organizzazioni.
Europeana Newspapers studierà anche la qualità delle tecnologie di affinamento e di trasformazione dei metadati nello standard Europeana Data Model.