Il Dna come ultima frontiera dell’archivizione dei dati. E’ la soluzione di storage per l’era digitale su cui sta lavorando Microsoft e che oggi raggiunge un traguardo essenziale per arrivare all’applicazione nei data center commerciali: l’automazione, parziale, del processo di scrittura, conservazione e recupero dei dati sul Dna sintetizzato in laboratorio.
In un test di tipo proof-of-concept, Microsoft insieme alla University of Washington ha infatti dimostrato il primo sistema completo automatizzato per conservare e recuperare i dati sul Dna. Il test è descritto nei dettagli su un articolo apparso du Nature Scientific Reports. Il team ha codificare la parola “hello” in pezzi di Dna sintetico e l’ha riconvertita in dati digitali usando un sistema end-to-end pienamente automatizzato. Le molecole di Dna sono create in laboratorio e i dati possono essere crittografati prima di essere inviati al sistema.
Il Dna, spiega Microsoft, può conservare informazioni digitali in uno spazio che è di un ordine di grandezza nettamente inferiore a quello impiegato dagli attuali data center. E’ una soluzione dalle potenzialità enormi per conservare quantità di dati massicci e che continuano ad aumentare ritmi esponenziali.
Il sistema di data storage automatizzato su Dna usa software sviluppato da Microsoft con l’Università di Washington e attrezzature di laboratorio commerciali per sintetizzare il Dna e recuperare le informazioni. I dati devono essere convertiti da 0 e 1 in molecole di Dna. Per ripristinare i dati nella forma digitale, il Dna viene sequenziato e i file decodificati di nuovo in 0 e 1. Ad oggi l’Università di Washington ha dimostrato di poter conservare e recuperare 1 gigabyte di dati sul Dna.
“Il nostro obiettivo finale è di mandare in produzione un sistema che, per l’utente finale, assomiglia a un qualunque servizio di storage cloud — i bit sono spediti a un datacenter che li conserva e riappaiono quando il cliente ne ha bisogno”, dichiara la ricercatrice di Microsoft Karin Strauss. Il proof-of-concept ha dimostrato che il sistema è fattibile in quanto automatizzabile.
Ora servono ulteriori passi in avanti: come spiega Chris Takahashi, senior research scientist della Paul G. Allen School of Computer Science & Engineering dell’Università di Washington, parti del processo non inserite del proof-of-concept continuano ad essere svolte manualmente in laboratorio e ciò rende il sistema non ancora adatto alla fase commerciale, perché lento e soggetto a errore, nonché costoso. Per questo Microsoft continua a lavorare per raggiungere un’automazione completa del processo.
L’obiettivo della ricerca di Microsoft sul Dna per lo storage dei dati è quello di trovare modi efficienti per chiudere il gap tra il volume di dati prodotti con l’economia digitale – IoT, manifattura 4.0, telemedicina, satelliti e così via – e la nostra capacità di conservarli. Una soluzione è lo sviluppo di algoritmi e tecnologie di computing molecolare per codificare e recuperare i dati sul Dna sintetico, capace di ospitare tutte le informazioni oggi conservate in un data center in uno spazio equivalente a qualche dado da gioco.
Salvare i dati sul Dna, sottolinea l’azienda americana, permette alle informazioni di durare fino a decine di migliaia di anni, mentre le attuali tecnologie di archiviazione si degradano nell’arco di qualche decennio. Secondo l’American Chemical Society il Dna è una soluzione potenziale per lo storage robusta e duratura. Teoricamente ipuò conservare 1 exabyte di dati – un miliardo di gigabyte – per millimetro cubo.