Cosa sono i Big Data e cosa comportano
Al giorno d’oggi si parla spesso di big data. Un termine sulla bocca di tutti, ma cosa significa davvero?
Non esiste una definizione vera e propria di “big data”, si è iniziato ad usare il termine quando la quantità di dati a disposizione delle aziende sono cresciuti così tanto che non potevano più essere immagazzinati e analizzati con gli stessi strumenti che venivano utilizzati in precedenza.
Dati strutturati e dati non strutturati
C’è da fare subito una distinzione tra i “dati tradizionali” e i nuovi tipi di dati che soprattutto con l’era del digitale hanno cominciato a sommergere le aziende.
- Dati strutturati: sono organizzati sotto forma tabellare, secondo schemi. Hanno campi e formati ben definiti.
Un esempio molto basilare di dati strutturati può essere quello rappresentato nell’immagine qui sotto. Nella colonna “Anno di nascita” sappiamo che ci sarà sempre un numero, nella colonna “Nome” ci sono tutti i nomi, ecc..
Questi costituiscono la maggior parte dei dati presenti nelle aziende italiane ad oggi e sono organizzati in database relazionali. - Dati non strutturati: sono dati non organizzati in maniera schematica bensì in forma libera, ad esempio testi, immagini, video, ecc. Il numero di questo tipo di dati sta crescendo sempre di più ed è necessario per le azienda capire come trattarli.
Pensiamo a colossi come Google o Facebook, che hanno a disposizione un’enorme quantità di dati non strutturati come immagini, commenti, video, interazioni tra utenti… Google ha a che fare con 24.000 Terabyte di dati al giorno, ed in Facebook vengono caricate più di 10 milioni di foto all’ora.
Come cambiano le analisi con l’introduzione dei big data
I dati sono cambiati, e anche il modo in cui analizziamo e trasformiamo le informazioni.
- Avendo a che fare con moli di dati molto più grandi, non ci si concentra più solo su un piccolo campione, ma spesso con la quasi totalità.
La grande quantità di dati che abbiamo a disposizione, sopsta il focus dall’esattezza del dato (livello micro) ad avere una visione generale sull’andamento delle cose.
Quando si trattavano campioni più piccoli, l’esattezza e la precisione del dato erano di fondamentale importanza. Con i big data, invece, si accettano errori e viene meno l’ossessione per la precisione del dato, focalizzandosi invece su concetti macro, che definiscano linee guida di andamento generale. - Il grande valore dei big data sta nel fatto di fare predizioni riguardo al futuro. Non ci si concentra più sul concetto di causalità come si è fatto storicamente, ma sul concetto di correlazione tra dati. Il focus non è più sul perché, ma sul cosa. Non abbiamo sempre bisogno di sapere il motivo per cui si verificano delle cose, con i big data ci si concentra a scoprire cose nuove. Ogni dataset ha dei valori intrinseci, nascosti e non compresi, la sfida è scoprire quali.
A cosa servono i big data
Essendo aumentata incredibilmente la mole di dati a disposizione, sono aumentate anche le cose che si possono fare con essi.
I big data si riferiscono a ragionamenti che possono essere fatti in grande scala e non a scale ridotte, per estrarre nuovi insight o creare nuove forme di valore che cambino non solo le aziende e i mercati ma anche le relazioni tra cittadini e governo e molto di più.
Ad esempio, incrociando centinaia di miliardi di termini di ricerca, Google ha predetto la diffusione dell’influenza in America, fornendo dati divisi per regione e stato. Questo è stato possibile semplicemente cercando le correlazioni tra le query di ricerca fatte sul motore di ricerca e la diffusione nel tempo e nello spazio.
Il mondo dei big data può avere ripercussioni su ogni cosa: scienze, cure sanitarie, governo, istruzione, economia, ed anche discipline umanistiche e ogni altro aspetto della società.
Come Amazon ci consiglia i libri che potrebbero piacerci, la stessa tecnologia può essere applicata per diagnosticare malattie, consigliare trattamenti o anche per identificare criminali prima ancora che commettano un crimine.
I benefici per la società sono innumerevoli, i big data possono essere utili anche per la soluzione di problemi globali complessi come il cambiamento climatico, sradicare le malattie e lo sviluppo economico.
The dark side of big data
- Molte decisioni possono essere prese da algoritmi invece che da esseri umani
- In quest’epoca data driven guidata da predizioni, la perdita del concetto di causalità in alcuni casi non può essere accettata. Ci sono certe decisioni che non possono essere prese senza sapere cosa motiva la scelta, ad esempio in medicina (non si possono prescrivere medicinali senza saperne il perchè) o in giurisprudenza.