Nel libro Planet Google del 2009 (in Italia Pianeta Google, edito da Sperling & Kupfer), Randall Stross riportava una dichiarazione di Sergey Brin (nella foto) in cui il cofondatore di Google diceva che il motore di ricerca definitivo doveva somigliare a Hal 9000, l’onnisciente supercomputer protagonista del film di Stanley Kubrick Odissea nello spazio. Sembrerebbe proprio che il sogno di Brin e Page sia più vicino. Big G presenta oggi a New York, al Conference on Knowledge Discovery and Data Mining, la cosiddetta Knowledge Vault, uno sconfinato archivio in cui sarà compreso tutto lo scibile umano e che permetterà a macchine e essere umani di comunicare senza più barriere linguistiche, fornendo in tempo reale risposte a tutti i tipi di quesiti, e addirittura riuscendo a dare, per esempio, inedite interpretazioni su eventi e personaggi storici alla luce del confronto di tutti i documenti storiografici e non a disposizione di quello che sarà un vero e proprio oracolo digitale.
I dettagli sono stati anticipati dal New Scientist in un lungo articolo dedicato alla nuova sfida di Google, una sfida intrapresa senza l’aiuto dell’uomo. Il processo di ricerca e acquisizione dei dati, infatti, è completamente gestito da macchine, guidate da uno speciale algoritmo, che compilano quel che è stato definito “knowledge base”. A differenza di un normale database, generalmente composto da numeri, il knowledge base raccoglie, elabora e mette in correlazione avvenimenti. Il management di Google ha deciso di intraprendere questa strada dopo essersi reso conto che il Knowledge Graph, l’attuale strumento alla base di tutte le risposte che fornisce il motore di ricerca, non poteva evolvere ulteriormente. Il motivo? La limitatezza della capacità di gestione umana. Via dunque alla totale automazione del processo, con macchine che raccolgono i raw data, i dati crudi, e li trasformano in elementi di conoscenza usabili e combinabili.
Al momento, dice il New Scientist, sono circa 1,6 miliardi gli avvenimenti censiti e raccolti nella Knowledge Vault. Di questi, circa 271 milioni sono contrassegnati come “assodati”, ovvero reali al 90%. Attualmente Knowledge Graph possiede una quantità superiore di dati, ma mentre il suo limite è vicino, il nuovo strumento tenderà a crescere esponenzialmente e in misura sempre maggiore, riuscendo anche a scandagliare fonti nascoste di dati, come per esempio i dati che alimentano le pagine dei prodotti di Amazon.
E la stessa Amazon, insieme agli altri big come Microsoft, Facebook e Ibm (all’opera già da anni col suo Watson), sta cercando di percorrere la strada. Lo sostiene l’analista di Gartner Tom Austin, secondo cui “questi grandi marchi dell’Ict sono oggi in grado di fare cose anche solo impensabili fino a dieci anni fa: Siri e Google Now verranno letteralmente surclassati da queste nuove vault. Prima della fine di questo decennio, avremo sistemi automatici che ci diranno quali sono le mail più importanti ricevute durante la giornata e sbrigheranno le altre senza che l’utente debba toccare alcun device”, continua Austin. “Informazioni su salute, turismo, cronaca e praticamente su qualsiasi altro ambito siano stati prodotti dati o registri di avvenimenti saranno disponibili in tempo reale prima ancora di essere richieste”.
Inutile dire che lo sviluppo di sistemi del genere, perennemente affamati di dati, renderà sempre più delicata la questione della privacy. Del resto, lo ricordiamo tutti, HAL 9000 non perdeva mai di vista i propri compagni di viaggio umani…