È una figura dai contorni ancora sfumati quella del Data Scientist, a cavallo tra la tecnologia pura e il business.
Ma in quella che chiamiamo Data Driven Society o Data Driven Economy il Data Scientist sta guadagnando una crescente riconoscibilità all’interno delle imprese e delle organizzazioni, in cerca di figure in grado di muoversi oltre la sola data analysis in una logica multisciplinare.
Non è un interesse di facciata: in gioco ci sono investimenti importanti, come emerge dai dati del rapporto più recente pubblicato dall’Osservatorio Big Data della School of Management del Politecnico di Milano, secondo il quale in Italia la spesa in ambito Big Data, non limitata alle sole attività di analytics, ha ormai superato il tetto del miliardo di euro, attestandosi a 1103 milioni, in crescita del 22 per cento rispetto ai 905 milioni dello scorso anno.
I dati ci sono: c’è bisogno di chi sappia trasformarli in valore.
Per questo nelle imprese è ormai in atto un movimento che da un lato punta a portarsi in casa nuove competenze, dall’altra cerca di abilitare a nuovi skill quelle che già ci sono.
Certo, la disomogeneità è evidente: il panorama italiano vede da un lato realtà che solo ora iniziano a fare i conti con la disponibilità crescente di dati, e che dunque cominciano adesso a muovere i primi passi nella Data Driven Economy, dall’altro il loro contraltare, vale a dire aziende per le quali il dato è il prodotto.
Tra i “Beginner” e le Data Driven Company si collocano poi altre aziende che hanno già maturato una consapevolezza sul valore dei dati di cui dispongono e che sul significato dei dati progettano e adattano il loro futuro.
Dato dunque per assodato che per molte imprese e organizzazioni è necessario andare oltre la data analysis, resta da capire quali sono le competenze che qualificano un data scientist.
Di certo, oltre alla conoscenza e padronanza degli strumenti di base, servono competenze in ingegneria del software, statistica, machine learning, algebra, analisi multivariata, data munging, data visualization, data communication.
E poi serve quella capacità di pensare “out of the box”, fuori dagli schemi e senza pregiudizi, dal momento a differenza del data analyst il data scientist opera senza sapere se e quali relazioni esistono tra i dati.
Infine, proprio per l’orizzonte ampliato lungo il quale il data scientist si muove, è necessario che interloquisca con altre figure aziendali, anche e soprattutto in line of business diverse dalla sua: per questo è indispensabile che sappia lavorare in team.
Quanto ai percorsi di formazione che portano a diventare data scientist, tre sono al momento le strade possibili.
Per i più giovani esistono percorsi universitari strutturati: sono in genere lauree magistrali, di impianto teorico, cui si affiancano percorsi pratici, tramite stage o progetti ad hoc.
Per chi ha già un lavoro o per chi non desidera o non può impegnarsi in un percorso full time di lunga durata, le alternative sono rappresentate da un lato dai corsi a distanza, i cosiddetti MOOC, i Massive Open Online Courses, organizzati da realtà come Coursera, Udacity, EdX e finanche dall’Unione Europea; dall’altro dai bootcamp, esperienze accelerate e tipicamente esperienziali, con connotazioni pratiche e di progetto.