I big data costituiscono un insieme di dati non strutturati e multistrutturati che contengono un grande volume di informazioni: un patrimonio sempre più importante anche in ambito sanitario, per comprendere l’origine e l’andamento delle malattie e delle epidemie – mettendo a confronto analisi cliniche, informazioni ambientali e stili di vita – ma anche per ottimizzare la gestione delle risorse in ambito sanitario, con grandi vantaggi in termini di prevenzione e riduzione dei rischi.
Non a caso, Fascicolo sanitario elettronico e piattaforme dati della sanità sono tra i nodi centrali del programma di digital transformation del Governo italiano. Mentre l’Europa punta alla creazione di uno spazio europeo dei dati (European Health Data Space – Ehds), che comprenda anche il settore sanitario, per il periodo 2019 -2025, con la finalità di “migliorare l’accesso a diversi tipi di dati sanitari (fascicoli sanitari elettronici, dati genomici, dati presi dai registri dei pazienti) e il loro scambio, non solo per sostenere l’erogazione dei servizi sanitari (il cosiddetto uso primario dei dati) ma anche a fini di ricerca e di elaborazione di politiche in ambito sanitario (il cosiddetto uso secondario dei dati)”. Tutto questo nel rispetto delle norme sulla protezione dei dati stessi (Gdpr).
I big data in sanità sono inoltre un mercato in crescita: se nel 2016 il mercato globale dei big data sanitari era valutato 11.5 miliardi di dollari, di recente una ricerca pubblicata su Statista stima che nel 2025 possa raggiungere un valore di 70 miliardi di dollari, con una crescita esponenziale del 568%.
L’emergenza legata alla diffusione del Covid-19, con l’esigenza di raccogliere numeri su contagi, ricoveri e vaccinazioni, non ha fatto altro che mettere in primo piano la già indiscussa importanza di questa mole imponente d’informazioni, che non provengono solo dalle strutture sanitarie, ma sono anche acquisiti tramite l’inserimento di informazioni sui social network o l’utilizzo di app di mobile Health o di wearable technologies dotate di sensori. Per esprimere il loro potenziale, tuttavia, i dati devono essere strutturati, ovvero integrati all’interno di un sistema; la loro dimensione inoltre rende necessaria l’Intelligenza artificiale – AI per gestirli, una tecnologia in continua evoluzione e miglioramento.
I principali ostacoli in questo percorso sono proprio la difficoltà nell’organizzare i dati non strutturati, ma anche la mancanza di competenze tecniche e competenze in metodi quantitativi e statistici, le problematiche di riservatezza e sicurezza dei dati, le sfide nell’analisi ad alte prestazioni (analisi predittiva, data mining, text mining, previsione e ottimizzazione). Un altro limite consiste nel fatto che i big data della Sanità provengono da strutture e settori che spesso non interagiscono: dai sistemi sanitari regionali a tutti gli enti e le istituzioni che a vario titolo si occupano di queste informazioni preziose. L’insieme dei dati e la loro interoperabilità possono aiutare a individuare connessioni, trend e orientamenti in grado di guidare decisioni predittive, che possano anticipare fenomeni. Qui entra in gioco l’AI: il Machine Learning, algoritmo dell’Intelligenza artificiale in grado di apprendere costantemente dai dati che riceve, è usato quasi come sinonimo di analisi predittiva.
È il passo successivo: per ora il livello di maturità nella valorizzazione dei dati sanitari in Italia mostra che le principali tipologie di dati raccolti e analizzati dalle strutture sanitarie italiane sono “i dati amministrativi, i dati clinici strutturati e non strutturati, i dati di imaging e i dati raccolti ai fini di ricerca. Maggior arretramento si riscontra, invece, per quanto riguarda i dati epidemiologici, i dati da registri clinici, i dati sanitari provenienti dal territorio e i dati omici. Infine, meno di un quarto del campione raccoglie e analizza i dati demografici e ambientali, i dati raccolti da oggetti intelligenti (es. App, werable, sensori, …) e i dai provenienti da web/social media1”.
Alle domande su big data e modelli One Health Data-driven proveremo a rispondere il 27 e 28 ottobre a Forum PA Sanità 2021 – evento digitale organizzato da FPA e P4I-Partners4Innovation, società del Gruppo Digital360 – attraverso il confronto con opinion leader, ricercatori, decision-maker e policy-maker. In particolare il 27 ottobre si svolgerà il convegno di scenario Data-driven One Health: conciliare la salute dell’uomo e quella del Pianeta sfruttando i Big Data e il 28 ottobre il talk Big data e analytics trasformeranno il Sistema Sanitario Nazionale.
Gli appuntamenti di ForumPA Sanità 2021, tutti gratuiti, saranno trasmessi in streaming sulla piattaforma di diretta di FPA, per seguirli è necessario accreditarsi dal sito dell’evento: https://forumpasanita2021.eventifpa.it