Qualità dei dati e modelli di qualità del sw dell’IA

I sottotitoli italiano, inglese, francese, spagnolo, portoghese, tedesco, giapponese, coreano, cinese e indiano sono tradotti in automatico (seleziona impostazioni video)

La qualità dei dati è definita in ambito ISO da quindici caratteristiche la cui osservanza garantisce che i dati siano: accurati, attuali, coerenti, completi, credibili, accessibili, comprensibili, conformi alle regole, efficienti, precisi, riservati, tracciabili, disponibili, portabili e ripristinabili [modello ISO/IEC 25012 [6.1]. 

Poiché gli algoritmi di intelligenza artificiale sono principalmente tarati, e in grado di apprendere, partendo da esperienze inerenti le realtà interessate, sarà vantaggioso in tutti i settori disporre di dati di qualità.

Nello standard si definisce il dato come “rappresentazione re-interpretabile di una informazione in un modo formalizzato utile per la comunicazione, l’interpretazione o l’elaborazione”.

Le quindici caratteristiche di qualità [6.2], inerenti i dati e dipendenti dal sistema che li elabora:
a) cinque caratteristiche “inerenti” il dato, cioè connesse al valore intrinseco del dato;
b) sette caratteristiche che dipendono sia dal dato stesso che dal sistema; 
c) tre caratteristiche esclusive del sistema che trattano il dato senza entrare nel merito del suo contenuto. 
Ad esempio, limitandoci alle prime cinque caratteristiche “inerenti”, il dato è di qualità se soddisfa:

  • accuratezza, intesa come perfetta rispondenza con il mondo reale che rappresenta;
  • attualità, cioè del giusto tempo in cui il dato è utilizzato;
  • coerenza, quindi un dato non è contraddittorio con altri dati;
  • completezza, è presente per tutti gli attributi necessari;
  • credibilità, il dato proviene da fonte certa.

I modelli di qualità sintetizzano ulteriori caratteristiche valide anche per il software e i servizi. A sua volta quindi il software che elabora i dati deve soddisfare le caratteristiche di specifici modelli di qualità [6.3, 6.4] che prevedono: idoneità funzionale, usabilità, compatibilità, affidabilità, sicurezza, performance, portabilità, manutenibilità. Inoltre i sistemi basati sull’Intelligenza artificiale hanno alcune caratteristiche uniche che favoriscono particolari elaborazioni di dati e che non sono contenute nel modello di qualità citato:  flessibilità, adattabilità, autonomia, evoluzione, distorsione, trasparenza / interpretabilità / esplicabilità, complessità e non determinismo [1.4]. L’intera serie di caratteristiche di qualità per i sistemi basati su AI potrebbe essere utilizzata come base per una lista di controllo utilizzata durante la pianificazione dei test per l’identificazione dei rischi che devono essere mitigati dai test, similmente ai test tradizionali [6.5].
I modelli devono essere utilizzati a priori per una completa progettazione di nuove applicazioni e a posteriori per le attività di test e come filtri di ciò che è errato nei dati o nel software, anche in manutenzione, con analisi adattate al mondo reale, e comprovando di continuo l’affidabilità dei modelli predittivi dell’IA.
Conformarsi ai modelli di qualità dei dati, del software e dell’IA non vuol dire aderire a filosofie tipo il “Dataismo” che sembra possa dare priorità dei dati rispetto all’interpretazione umana. E’ semmai il contrario: l’uomo che definisce i modelli di orientamento vuole garantire nei limiti del possibile la credibilità dei dati e delle appropriate elaborazioni a fini di studio, ricerca e di ciò che è vero nei fenomeni. Anche i dati, come l’IA stessa, sono elementi di base “donati” alla Governance umana, rispondenti ai principi etici trasparenti che la sostengono.

Glossario a cura di Domenico NATALE e Videoglossario a cura di Maria Chiara LORENZELLI

__________
Riferimenti bibliografici

[6.1] ISO/IEC 25012: 2008 – Software engineering — Software product Quality Requirements and Evaluation (SQuaRE) — Data quality model

[6.2] Voce a cura di D. Natale cit. in Dizionario di Scienze e Tecniche “La Comunicazione” Facoltà di Scienze della Comunicazione dell’Università Pontificia Salesiana a cura di Franco Lever, Pier Cesare Rivoltella, Adriano Zanacchi

[6.3] ISO/IEC 25010:2011 – Systems and Software engineering – Systems and Software product Quality Requirements and Evaluation (SQuaRE) — System and software quality models

[6.4] D. Natale “Orientamenti sul modello di qualità dell’Intelligenza Artificiale” riportati sul portale alla voce IA approfondimenti https://intelligenzartificiale.unisal.it/modelli-di-qualita-per-lintelligenza-artificiale

[6.5] ISO/IEC/IEEE DIS 29119-2-3-4:2020 (ed. 2) Software and systems engineering – Software testing