Big data

Fin dagli anni ’90 si parla di Big data. Volumi enormi di dati con formati diversi, sorgenti diverse, a volte inafferrabili e non facilmente interpretabili e visibili. Se i tanti dati sperano in ausili di interpretazione dall’IA, l’IA stessa spera di poter attingere dai Big data. Le tecniche statistiche dei Big data possono aiutarci particolarmente nella ricerca di “andamenti costanti” nel “caos” del mondo variabile. 
Si sta verificando una simbiosi tra i due approcci della qualità dei dati e dei Big data, tant’è che a livello della standardizzazione ISO essi sono stati accorpati negli studi dello stesso sottocomitato SC42 [7.1].
Se la progettazione della qualità dei dati (citata nel punto 6 precedente) si può intendere come una analisi preventiva di sistemi dati di qualità a favore dell’interoperabilità, ottimizzazione, interpretazione, correzione e interscambio dati, l’adozione di tecniche di Big data può andare in soccorso perfino alla mancanza di qualità progettata attingendo velocemente con sofisticate tecniche statistiche da fonti estemporanee e non del tutto progettate a priori.
Lo standard ISO/IEC FDIS 20546 [7.2] definisce i Big data come un dataset esteso (collezione di dati), con principali caratteristiche di volume dimensionale, varietà dei formati, velocità di analisi ed elaborazione e/o variabilità delle strutture, che richiedono una tecnologia scalabile che garantisca memorizzazioni efficienti, manipolazioni, gestione e analisi. A volte il termine Big data è usato in differenti modi, per esempio per indicare la tecnologia stessa utilizzata per maneggiare i dati, più che il dataset esteso. Spesso il termine è associato anche alla Data science che si riferisce al processo di estrazione della conoscenza dai dati attraverso esplorazioni e ipotesi di test. In ogni caso la disponibilità di Big data è tra i fattori portanti dell’IA assieme al miglioramento degli approcci machine learning e capacità di elaborazione dei computer quantici.

Riferimenti bibliografici

[7.1] www.iso.org (voce ISO/IEC JTC1/SC42  Artificial Intelligence)
[7.2] ISO/IEC FDIS 20546:2018 Information Technology – Big data – Overview and vocabulary