Domenico NATALE, Statistico demografico, Member of ISO/IEC JTC1 SC7/WG6 “Software Engineering” – Membro Commissione UNINFO UNI CT 533 “Intelligenza Artificiale” e Commissioni internazionali di standardizzazione ISO, CEN-CENELEC – Presidente Commissione UNI CT 504 “Ingegneria del software”
L’abbondanza di dati digitali sta sovrastando le società moderne con numeri tali che è lecito sperare in un aiuto da parte delle nuove tecnologie digitali per risolvere il governo di nuovi fenomeni complessi e difficili da monitorare e comprendere.
Il potenziamento delle capacità di elaborazione e delle tecniche si profila utile in molti settori: economia, commercio, ambiente, aria, acqua, venti, inquinamento, salute, densità delle abitazioni e delle popolazioni, istruzione, comunicazione, migrazioni, turismo, smart city, energia, agricoltura, trasporti, settore alimentare, ecc..
Molte elaborazioni di dati potranno essere agevolate in questi ed altri campi avvalendosi dell’Intelligenza Artificiale, con elaborazioni automatiche “intelligenti”, semi-automatiche e assistite da intelligenza umana.
Poiché gli algoritmi di intelligenza artificiale sono principalmente tarati, e in grado di apprendere, partendo da esperienze inerenti le realtà interessate, sarà vantaggioso in tutti i settori disporre di dati di qualità: accurati, attuali, coerenti, completi, credibili, accessibili, comprensibili, conformi alle regole, efficienti, precisi, riservati, tracciabili, disponibili, portabili e ripristinabili, secondo le definizioni del modello UNI CEI ISO/IEC 25012.
Ma un problema attuale, preoccupante a livello mondiale ed in cui ci si aspetta in tempi brevi nuovi supporti elaborativi, è quello delle pandemie, causata da elementi invisibili, scientifici, naturali e comportamentali. Ad esempio non si può non pensare alla diffusione epidemica del Covid nel 2020 in Italia e nel mondo.
Da alcuni dati desunti da post-elaborazioni degli Open data del Dipartimento della Protezione Civile relativi all’epidemia in atto, è possibile calcolare per regione il tasso dei contagi attuali sulla popolazione, con alcune evidenze di differenza tra zone industriali e rurali, tra nord e sud, tra ambienti turistici o meno. Tabelle di sintesi sono riportate in “Morbosità delle regioni italiane e assistenza sanitaria nell’epoca del Covid-19“.
Si possono anche evidenziare tendenze in base alla correlazione del Covid col minore o maggiore sviluppo delle regioni italiane come riportato nel sito personale mondomatica.it, paragrafo a) e b).
Si intende evidenziare che la speranza riposta nell’IA possa essere di aiuto come strumento di analisi e previsione dei fenomeni connessi, e complessi, con tali andamenti, focalizzando le numerose concause.
Si prevede su questo un’IA, affiancata dalle tecniche dei Big data, a servizio delle indagini scientifiche, a vari livelli, principalmente:
- farmacologico, medico, virologico;
- delle cure e degli strumenti;
- nella comprensione dei fenomeni e comportamenti sociali e demografici, come strumento preventivo o di monitoraggio per disporre di campanelli d’allarme (come l’RT) e per migliorare la programmazione di pronti interventi.
In questo articolo ci si focalizza su quest’ultimo aspetto dell’ambito sociale e demografico, in particolare esaminando la componente territoriale nelle analisi. Il problema pandemico riguarda tutto il mondo, tutti i continenti, stati, unioni di stati, regioni, province, comuni.
Il problema della supervisione dei dati è presente a vari livelli presentandosi e riproponendosi anche nelle aree regionali e territoriali. In questa sede si accenna ad alcuni esempi di analisi “tradizionale” di regionalizzazione dei fenomeni per sollecitarne di nuove.
Il tema delle statistiche territoriali e delle differenze territoriali è stato da sempre oggetto di studio, per tutti i settori di interesse, da parte delle istituzioni pubbliche, università, enti di ricerca pubblici e privati. E l’analisi delle differenze è sempre uno sprone a capire le cause del verificarsi dei fenomeni.
Circa 40 anni fa, nel 1975, chi come il sottoscritto era alle prese con ricerche basate su molte variabili nel campo della Statistica sociale e demografica, ci si ritrovava ad esempio a studiare (utilizzando “manualmente” solo semplici calcolatrici e mainframe dell’archeologia informatica) le regioni italiane dal punto di vista dello sviluppo economico e sociale, non solo in base al reddito, ma anche sulla base di 22 indicatori, prescelti con matrici di correlazioni e analisi fattoriali, allora miracolose.
Analisi concrete esemplificative, tra le innumerevoli esperienze esistenti, si ritrovano in esempi pionieristici di quantificazione della stima del divario nord-sud delle regioni italiane secondo il Censimento Istat del 1971, come in: a) Sviluppo socio economico delle regioni e sanitario. Tale studio fornisce un contesto storico tuttora utile in cui si possono inserire nuove quantificazioni di vari fenomeni compreso il fenomeno del contagio attuale dell’epidemia dal Coronavirus sul territorio.
Si rilevava nello studio del 1975 sui dati del censimento del 1971, di cui al link suddetto, una analoga situazione evidenziata dal citato studio del Sole 24 ore del 2000: il nord d’Italia era “lanciato” verso il post “boom economico” ed il sud era meno industrializzato e caratterizzato da grandi migrazioni al nord. Un sud, che anche a causa della conformazione geografica e aspetti infrastrutturali, risultata meno “frequentato” in certe stagioni, con meno contatti interpersonali. Nel contempo quindi, involontariamente e autonomamente, si stavano già verificando al sud comportamenti di “distanziamento sociale”; forse oggi potremmo dire che questo aspetto ritenuto negativo rispetto a diffusi modelli di sviluppo, si è rivelato fortuitamente un fattore di salvaguardia delle regioni del sud nel caso epidemico. Probabilmente non c’è stagionalità nell’epidemia, ma c’è una stagionalità indiretta di comportamenti sociali, specie legati in Italia al turismo, estivo dalle città verso mare e montagna, ed invernale dalle città verso le zone sciistiche. Di fatto da marzo a giugno del 2020 la situazione geografica dell’epidemia si è rilevata geograficamente come riportato in: b) Correlazione tra sviluppo territoriale e epidemia Covid.
Negli anni recenti, ed in particolare ai nostri giorni, istituzioni tecniche, comitati scientifici, aziende ed esperti stanno approfondendo sempre più tale tema delle peculiarità territoriali pervenendo inevitabilmente anche alle diversità regionali, provinciali e comunali. Si stanno creando anche indicatori, con mezzi multimediali, rilevazioni satellitari, uso di tecnologie d’avanguardia, App, come la Immuni, Big data. La distribuzione dei contagi nelle regioni sembra far emergere ancora una situazione capovolta rispetto ai modelli basati sul PIL: un sud sostanzialmente più immune dal punto di vista della morbosità, un nord più esposto, che paga l’intensissima mobilità interna all’Italia e verso l’estero per vari motivi: di produzione, di lavoro e di turismo. Un nord più esposto con intense attività commerciali e finanziarie, denso di industrie e di persone, di forti relazioni con l’Europa e il mondo.
In ogni caso si stanno confermando diversità sempre esistite, che andranno viste non nell’ottica del passato, ma nella consapevolezza delle potenzialità preziose della nostra Italia, bislunga e originale, immutabile nella forma, al punto che, come ha affermato in una recente intervista l’astronauta Luca Parmitano, essa risulta il Paese più facilmente distinguibile dallo spazio (si analizzi la probabile correlazione tra le aree luminose e quelle di maggior possibilità contagio).
Le evoluzioni in atto, determinate dalle pandemie e epidemie, rendono necessarie nuove scelte di nuovi indicatori di controllo rispetto a quelle di un tempo e nuove proporzioni tra fenomeni. Gli indicatori che allora erano ritenuti di contorno al concetto di sviluppo, come la morbosità e l’assistenza sanitaria, ora sono divenuti primari mentre gli altri economici divengono di contorno, nel tentativo di spiegare il fenomeno e studiarne le conseguenze, specie occupazionali. E’ necessario infatti focalizzarsi adesso sulla morbosità come fattore principale da sconfiggere e capire, rendendo tutte le altre componenti collaterali, di supporto alla ricerca medica, scientifica e statistica alla ricerca di cause e soluzioni che possano rilanciare l’economia ed il lavoro. Al di là di studi socio-economici sono anche interessanti studi di approfondimento degli impatti dell’inquinamento dell’aria e dei venti sui fenomeni epidemiologici.
I problemi, già di difficile comprensione per la loro vastità sociale, diventano ora problemi “critical life” di assoluta criticità e priorità. Le statistiche sanitarie e del lavoro hanno bisogno di ulteriori attenzioni e analisi dei dati.
Si confida che l’IA, basata su dati appropriati di qualità ed algoritmi scientifici, possa dare un contributo a livello consuntivo e preventivo, per segnalare allarmi in anticipo, e aiutare a livello consuntivo per il monitoraggio dei fenomeni e cura delle persone. Anche l’uso di appositi campioni statistici casuali/stratificati, integrati con tecniche dei Big data, potranno aiutare a monitorare al meglio fenomeni così importanti.
Si auspica che nel Convegno sull’IA del 25-26 settembre 2020, emergano altre ricerche ed esperienze già esistenti sulle osservazioni di realtà territoriali e si possano sollecitare anche nuovi contributi utili per l’ideazione di futuri servizi di IA, per consentire alle istituzioni competenti e alle organizzazioni coinvolte di poter agire non solo in situazioni emergenziali, ma con modalità continue, sistemiche e con le più moderne soluzioni possibili e condivisioni etiche.
__________
Domenico Natale, laureato in Scienze Statistiche e Demografiche all’Università Sapienza di Roma, è esperto internazionale dell’ISO/IEC JTC1 SC7/WG6 e si occupa di qualità del prodotto software, dati, servizi IT, qualità in uso. Opera in ambito ISO dal 1994 ed è stato editor e co-editor di vari standard sviluppati nell’ambito della serie ISO/IEC 25000 – SQuaRE – Software Quality Requirements and Evaluation. Ha lavorato per 35 anni in Sogei, primaria società di informatica italiana, in particolare nel settore statistico-metodologico, degli standard di processo, produttività, qualità del prodotto e benchmarking. E’ stato autore nel 1995 del libro “Qualità e quantità nei sistemi software” in cui sono state descritte le attenzioni date agli standard vigenti, all’usabilità ed alle misurazioni di qualità. Negli anni è stato co-autore di libri su metriche, qualità dei dati, accessibilità del web, ed ha scritto diversi articoli in riviste specializzate. Ha partecipato come speaker a oltre 100 eventi nazionali e internazionali ed effettua seminari in Aziende e Università. Attualmente è Presidente della Commissione UNI/CT 504 Ingegneria del Software, è membro delle Commissioni UNI Intelligenza Artificiale, e-Accessibility, e-Health e delle Associazioni CDTI, GuFPi-ISMA, SGI. E socio onorario UNINFO e promuove convegni di disseminazione di conoscenza tecnico-scientifica in sinergia con l’ISO/SC7 AG 3 – Advisory Group Communications & Outreach e altre realtà ISO-CEN-CENELEC.