IL PAGINONE

Digital dark age, il futuro è senza dati?

Viviamo in un’epoca in cui si rischia di disperdere al vento info e documenti born-digital, così come quelli convertiti da analogici a digitali, lasciando i posteri privi di eredità culturale. Ma biblioteche e PA iniziano a correre ai ripari

Pubblicato il 18 Nov 2012

dati-data-storage-120125112112

La prima pagina web del mondo, quella che dette ufficialmente il via al World Wide Web il 6 agosto 1991, è sparita dalla rete: l’Url originario rimanda a un sito molto più recente con i dettagli della storica scoperta di Tim Berners-Lee al Cern di Ginevra.
Non è l’unico, clamoroso caso di perdita dei dati. Eppure il Domesday Book, poderoso censimento di Inghilterra e Galles voluto da Guglielmo il Conquistatore nel 1086-1087, è consultabile a distanza di un millennio presso i National Archives di Londra. Non si può dire lo stesso di una ricerca commissionata in occasione del suo 900esimo anniversario: registrata su dischi laser da 12 pollici, dopo neanche una trentina d’anni è illeggibile perché il formato è diventato obsoleto.
Per non parlare della perdita di dati personali: sono centinaia di migliaia gli studenti universitari degli anni ‘80 che scrissero la tesi di laurea in un formato oggi scomparso e la conservarono su un floppy i cui lettori sono ormai fuori produzione da oltre 20 anni, con il risultato che adesso non è possibile neanche rileggerla in video.

Episodi come questi hanno indotto gli esperti a parlare di Digital Dark Age, medioevo digitale: un’epoca in cui si rischia di disperdere al vento dati e documenti born-digital (nati digitali), così come quelli convertiti da analogici a digitali, lasciando i posteri privi di eredità culturale. Uno dei principali timori legati alla conservazione dei dati è che gli elementi raccolti in un data center possano essere spazzati via da eventi naturali come terremoti, inondazioni o altre devastazioni. Sarebbe la replica di quello che accadde alla Biblioteca d’Alessandria, considerata la più grande e ricca del mondo antico, che andò distrutta più volte tra il 48 a.C. e il 642 d.C. Ma, nel caso di catastrofi, la soluzione è piuttosto semplice: è sufficiente conservare i dati in diversi data center sparsi per il mondo, cosa che i maggiori enti impegnati nella conservazione digitale stanno già facendo.
Ci sono però rischi più stringenti: l’obsolescenza di hardware e software, quella dei supporti e dei formati elettronici. Per affrontare questi problemi gli scienziati hanno escogitato una serie di strategie, tra cui il refreshing e la migration (vedi intervista). Al di là delle problematiche legate alla conservazione, ci si chiede chi e come si stia preoccupando, nel mondo, di analizzare, catalogare ed archiviare la mole di dati digitali in continua espansione.


Uno degli esempi più interessanti a livello internazionale è l’americano “Internet Archive” (vedi box). Un suo spin-off è Open Library che punta ad avere un sito web per ogni libro pubblicato nel mondo. Finora ha immagazzinato informazioni su oltre 20 milioni di titoli e scannerizzato i contenuti di circa 1,7 milioni di volumi non più tutelati da copyright. Sempre in Usa la Library of Congress, enorme biblioteca di Washington che vanta oltre 151,8 milioni di esemplari (libri, video, mappe, manoscritti, ecc. ecc.), conserva nei suoi archivi web circa 10mila siti, molti dei quali di proprietà del governo Usa. Il progetto è stato avviato nel 2000 grazie a circa 100 milioni di dollari di finanziamento pubblico. In Gran Bretagna la British Library sta archiviando da tempo tutto il materiale online prodotto dal Paese: per evitare rischi connessi alle catastrofi naturali ha luoghi di storage a Londra, nello Yorkshire, nel Galles e in Scozia. Sempre nel Regno Unito i National Archives conservano copie di tutti i siti governativi.

In Italia, oltre al Polo di conservazione del Notariato (vedi box), ci sono alcune significative realtà a livello regionale. In Emilia Romagna c’è il Parer (Polo Archivistico dell’Emila Romagna), che si occupa di conservare il patrimonio documentale informatico dell’intero territorio regionale. In Toscana il progetto Dax (Digital Archives Exchange), incentrato sulla conservazione degli archivi prodotti per via digitale dalla PA locale. Nelle Marche il Polo Marche DigiP, nato con l’obiettivo di conservare a lungo termine gli archivi e altri oggetti digitali della Regione e degli enti regionali. Sta partendo il Polo di conservazione digitale dell’Archivio centrale dello Stato: si occuperà di conservare gli archivi digitali prodotti dalle amministrazioni centrali. Anche la Biblioteca Vaticana si sta attrezzando: ha intenzione di digitalizzare circa 80mila manoscritti della sua collezione e, per essere lungimirante, usa il formato Fits, sistema di archiviazione informatica libero messo a punto dalla Nasa, che dà garanzie di essere leggibile anche tra 100 anni. L’obiettivo di tutte queste esperienze è evitare di ripetere errori come quello del settimanale The Economist, che ha fatto copie digitali di ogni singolo numero della rivista dal 1843 a oggi, ma ha perduto per sempre tutti i testi contenuti nella sua prima versione web nata nel 1994.

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Articoli correlati