Qualità dei dati e modelli di qualità dell’IA

Poiché gli algoritmi di intelligenza artificiale sono principalmente tarati, e in grado di apprendere, partendo da esperienze inerenti le realtà interessate, sarà vantaggioso in tutti i settori disporre di dati di qualità: accurati, attuali, coerenti, completi, credibili, accessibili, comprensibili, conformi alle regole, efficienti, precisi, riservati, tracciabili, disponibili, portabili e ripristinabili, secondo le definizioni ad esempio il modello ISO/IEC 25012 [6.1]. 

Nello standard si definisce il dato come “rappresentazione re-interpretabile di una informazione in un modo formalizzato utile per la comunicazione, l’interpretazione o l’elaborazione”.

Le quindici caratteristiche di qualità [6.2], inerenti i dati e dipendenti dal sistema che li elabora:
a) cinque caratteristiche “inerenti” il dato, cioè connesse al valore intrinseco del dato;
b) sette caratteristiche che dipendono sia dal dato stesso che dal sistema; 
c) tre caratteristiche esclusive del sistema che trattano il dato senza entrare nel merito del suo contenuto. 
Ad esempio, limitandoci alle prime cinque caratteristiche “inerenti”, il dato è di qualità se soddisfa:

  • accuratezza, intesa come perfetta rispondenza con il mondo reale che rappresenta;
  • attualità, cioè del giusto tempo in cui il dato è utilizzato;
  • coerenza, quindi un dato non è contraddittorio con altri dati;
  • completezza, è presente per tutti gli attributi necessari;
  • credibilità, il dato proviene da fonte certa.

A sua volta il software dell’IA deve soddisfare le caratteristiche dei modelli di qualità [6.3, 6.4] che prevedono: idoneità funzionale, usabilità, compatibilità, affidabilità, sicurezza, performance, portabilità, manutenibilità. Tuttavia i sistemi basati sull’intelligenza artificiale hanno alcune caratteristiche uniche che non sono contenute nel modello di qualità citato:  flessibilità, adattabilità, autonomia, evoluzione, distorsione, trasparenza / interpretabilità / esplicabilità, complessità e non determinismo [1.4]. L’intera serie di caratteristiche di qualità per i sistemi basati su AI potrebbe essere utilizzata come base per una lista di controllo utilizzata durante la pianificazione dei test per l’identificazione dei rischi che devono essere mitigati dai test, similmente ai test tradizionali [6.5].
I modelli devono essere utilizzati a priori per una completa progettazione di nuove applicazioni e a posteriori per le attività di test e come filtri di ciò che è errato nei dati o nel software, anche in manutenzione, con analisi adattate al mondo reale, e comprovando di continuo l’affidabilità dei modelli predittivi dell’IA.
Conformarsi ai modelli di qualità dei dati, del software e dell’IA non vuol dire aderire a filosofie tipo il “Dataismo” che sembra possa dare priorità dei dati rispetto all’interpretazione umana. E’ semmai il contrario: l’uomo che definisce i modelli di orientamento vuole garantire nei limiti del possibile la credibilità dei dati e delle appropriate elaborazioni a fini di studio, ricerca e di ciò che è vero nei fenomeni. Anche i dati, come l’IA stessa, sono elementi di base “donati” alla Governance umana, rispondenti ai principi etici trasparenti che la sostengono.

__________
Riferimenti bibliografici

[6.1] ISO/IEC 25012: 2008 – Software engineering — Software product Quality Requirements and Evaluation (SQuaRE) — Data quality model

[6.2] Voce a cura di D. Natale cit. in Dizionario di Scienze e Tecniche “La Comunicazione” Facoltà di Scienze della Comunicazione dell’Università Pontificia Salesiana a cura di Franco Lever, Pier Cesare Rivoltella, Adriano Zanacchi

[6.3] ISO/IEC 25010:2011 – Systems and Software engineering – Systems and Software product Quality Requirements and Evaluation (SQuaRE) — System and software quality models

[6.4] Modelli di qualità dell’Intelligenza Artificiale riportati sul portale alla voce IA approfondimenti https://intelligenzartificiale.unisal.it/modelli-di-qualita-per-lintelligenza-artificiale

[6.5] ISO/IEC/IEEE DIS 29119-2-3-4:2020 (ed. 2) Software and systems engineering – Software testing