Fin dagli anni ’90 si parla di Big data. Volumi enormi di dati con formati diversi, sorgenti diverse, a volte inafferrabili e non facilmente interpretabili e visibili. Se l’uomo spera in ausili di interpretazione dall’IA per comprendere i tanti dati, l’IA stessa spera di poter attingere dalle tecniche dei Big data. Le tecniche statistiche dei Big data possono aiutarci particolarmente nella ricerca di “andamenti costanti” nel “caos” del mondo variabile.
Si sta verificando una interrelazione tra gli approcci della IA, qualità dei dati e dei Big data, tant’è che a livello della standardizzazione ISO essi sono oggetto di studio dello stesso sottocomitato SC42 [7.1].
Se la progettazione della qualità dei dati (citata nel punto 6 precedente) implica una analisi preventiva di sistemi dati di qualità a favore dell’interoperabilità, ottimizzazione, interpretazione, correzione e interscambio dati, l’adozione di tecniche di Big data può andare in soccorso perfino alla mancanza di qualità progettata attingendo velocemente con sofisticate tecniche statistiche da fonti estemporanee e non del tutto progettate a priori.
Lo standard ISO/IEC 20546 [7.2] definisce i Big data come un dataset esteso (collezione di dati), con principali caratteristiche di volume dimensionale, varietà dei formati, velocità di analisi ed elaborazione e/o variabilità delle strutture, che richiedono una tecnologia scalabile che garantisca memorizzazioni efficienti, manipolazioni, gestione e analisi. A volte il termine Big data è usato in differenti modi, per esempio per indicare la tecnologia stessa utilizzata per maneggiare i dati, più che il dataset esteso. Spesso il termine è associato anche alla Data science che si riferisce al processo di estrazione della conoscenza dai dati attraverso esplorazioni e ipotesi di test. In ogni caso la disponibilità di Big data è tra i fattori portanti dell’IA assieme al miglioramento degli approcci machine learning e capacità di elaborazione dei computer quantici.
Glossario a cura di Domenico NATALE e Videoglossario a cura di Maria Chiara LORENZELLI
_______
Riferimenti bibliografici
[7.1] www.iso.org (voce ISO/IEC JTC1/SC42 Artificial Intelligence)
[7.2] ISO/IEC 20546:2019 Information Technology – Big data – Overview and vocabulary