Un mondo di dati

di Antonio Manzalini – NP maggio 2013

La diffusione del web e dei Social Media sta digitalizzando il Pianeta: sembra che circa un terzo della popolazione mondiale si connetta abitualmente ad Internet. Ogni giorno miliardi di persone usano il web per comunicare, scambiare messaggi, accedere ad informazioni, riversando, più o meno inconsapevolmente, un’enorme quantità di dati, spesso personali, sul web. Complessivamente, questi dati stanno crescendo in maniera esponenziale: la loro quantità raddoppia ogni due anni tanto aver raggiunto oggi l’ordine di grandezza dei Zettabyte, ovvero mille miliardi di miliardi di byte. Quali sono le opportunità di utilizzo di questa enorme quantità di dati ?

Vi suggerisco la lettura del romanzo “La Finestra Rotta” di Jeffery Deaver. È un thriller, per certi versi inquietante, ma la cui finzione narrativa offre interessanti riflessioni. La trama riguarda le indagini su una catena di omicidi a New York. L’evidenza di prove schiaccianti verso un presunto colpevole, Arthur Rhyme, insospettisce Lincoln, criminologo tetraplegico geniale, che decide di esaminare l'ultimo caso, per scagionare il cugino Arthur. Le sue ricerche lo portano ad un società che raccoglie impressionanti quantità di dati sulla vita e sulle abitudini della gente comune: una delle più grandi aziende di data mining del mondo, capace di raccogliere un database contente diverse centinaia di Petabyte di informazioni private e pubbliche su milioni di cittadini americani.

Non arrivo a svelarvi chi è veramente l’assassino, ma queste poche battute sulla trama del thriller fanno riflettere: è davvero possibile che le nostre idee, le nostre abitudini, così come i nostri dati biologici e sensibili, possano essere raccolti e utilizzati da qualcuno per influenzare le nostre decisioni e orientare il corso della nostra vita ?
Una ricerca, pubblicata sulla rivista scientifica americana Pnas, ha dimostrato che a partire da informazioni facilmente accessibili come i “Mi piace” su Facebook è possibile individuare con elevata accuratezza dati personali sensibili quali: l’età, il sesso, l’etnia, le opinioni politiche, il credo religioso, e persino aspetti relativi alla personalità. I ricercatori hanno in pratica sviluppato un modello statistico che si è rivelato estremamente accurato nell’identificare il profilo dei 58.000 volontari utenti di Facebook.

Un altro esempio. Provate a cercare sul web informazioni su voi stessi. 123people è un servizio web online gratuito che consente di visualizzare in un’unica pagina tutti i contatti, le foto, i video, la biografia e molte altre informazioni personali raccolte sul web, accessibili a tutti. È sorprendente. Oggi i nostri dati personali rappresentano la “moneta” con la quale paghiamo l’accesso al web, o ai servizi gratuiti di Google, anche al costo di perdere la nostra privacy. Quanto, prima della rivoluzione digitale, era considerato strettamente personale e privato (opinioni, comunicazioni, abitudini, articoli della spesa, medicine, etc) sta sempre più trasformandosi in un’enorme quantità di dati ed informazioni raccolte in database. Non dimentichiamo anche le milioni di fotografie scattate giornalmente dai satelliti militari: ci sono dei programmi di riconoscimento d’immagine che riescono a capire l’espressione di un volto a partire da una foto scattata via satellite.

Il problema ovviamente non è la disponibilità di questa enorme mole di dati personali, ma è come vengono usati. In linea di principio, questi dati potrebbero essere utilizzati per migliorare le condizioni della qualità della vita, e per offrire servizi migliori, soprattutto quando integrati con quelli relativi all’ambiente nel quale viviamo.
I modelli di sviluppo delle Città Intelligenti costituiscono un esempio: l’idea si basa sull’impiego diffuso di sensori, attuatori e soluzioni ICT (Information Communication Technologies) allo scopo di migliorare la comunicazione, la mobilità, l'ambiente e l'efficienza energetica delle città. I dati raccolti in ambiente urbano sono elaborati ed utilizzati per attuare delle politiche di miglioramento della qualità della vita dei cittadini. Grazie al continuo abbattimento dei costi tecnologici, si stima che nel giro di qualche anno saranno disponibili circa un miliardo di sensori in giro per il mondo, in grado di rilevare dati ambientali e quindi fornirci preziose informazioni.

Un esempio è il “naso” elettronico: un insieme di sensori (detto anche matrice di sensori), che viene utilizzato per misurare lo stato chimico di un determinato ambiente, ovvero la presenza di più specie chimiche, con le loro concentrazioni. Il naso elettronico è una preziosa fonte di dati per tenere sotto controllo i livelli di inquinamento ambientale e quindi intervenire in caso di necessità. Ci sono anche progetti ed iniziative volte al miglioramento della produzione agricola: l’utilizzo dei dati raccolti permetterebbe di ottimizzare i processi nel settore agroalimentare.

Credo tuttavia che ci sia un’altra area dove il tema dell’utilizzo dei dati ha un elevatissimo potenziale: quello delle banche dati del genoma umano. In particolare si tratta dell’acquisizione di dati per individuare l'eventuale implicazione di alterazioni nella sequenza del DNA nello sviluppo di patologie nell'uomo, e per comprendere le basi genetiche dell'evoluzione e del funzionamento dell'organismo.

Il genoma è l'insieme di tutte le informazioni genetiche codificate nella sequenza del DNA contenuto nel nucleo delle cellule sotto forma di cromosomi. Ogni cromosoma è costituito da un lungo filamento di DNA secondo una complessa struttura tridimensionale. Si stima che nel genoma umano siano presenti circa 50.000 geni. L’idea è sequenziare il genoma, ovvero leggere l’ordine secondo il quale sono disposte le lettere del patrimonio genetico. Anche il genoma è codificabile in un insieme di dati: ad esempio, un grammo di DNA può contenere fino a 700 Terabyte di dati, che corrispondono a 14.000 dischi Blue-ray da 50 GB.

Gli interessi commerciali per lo sfruttamento di questi dati sono molto forti. Dal 2000 ad oggi si contano milioni di domande di brevetto. Un recente studio pubblicato su Genome Medicine, sostiene che quasi tutta la sequenza genetica umana sarebbe ormai coperta da brevetto. Quindi se da una parte la digitalizzazione del genoma potrebbe determinare grandi progressi scientifici nello studio, e magari nella risoluzione, di molte patologie, viene da chiedersi se il possesso dei brevetti sul genoma da parte di poche società sia davvero lecito.


 

Questo sito utilizza cookie, anche di terze parti, per migliorare la tua esperienza e offrire servizi in linea con le tue preferenze.

Chiudendo questo banner, scorrendo questa pagina o cliccando qualunque suo elemento acconsenti all’uso dei cookie.

E' possibile modificare le opzioni tramite le impostazioni del Browser. Se vuoi saperne di più o negare il consenso clicca su informazioni.