Tech
Video

La qualità dei dati, pietra angolare di una Smart City

La qualità dei dati, pietra angolare di una Smart City

Una Smart City può essere vista come un “sistema di sistemi data driven” cioè un complesso di organizzazioni pubbliche e private che, utilizzando sistemi di intelligenza artificiale, sviluppano congiuntamente e costantemente processi guidati dai dati. La qualità di tali dati influenza moltissimo la funzionalità e l’affidabilità degli stessi sistemi. Per questo motivo, i dati devono sempre essere esatti, pertinenti, rappresentativi e privi di errori, nonché completi alla luce delle finalità previste.

Notizie correlate

Per garantire servizi efficienti ai cittadini una Smart City deve essere costruita sulla roccia, cioè su dati di elevata qualità gestiti in un quadro di trasparenza, accuratezza, robustezza e sorveglianza umana.

Dalla qualità dei dati dipende l’affidabilità dei sistemi

In una Smart City, gran parte dei processi di fornitura dei servizi sviluppati dai players pubblici e privati sono basati sull’utilizzo di sistemi di intelligenza artificiale (IA). Si tratta di algoritmi:

  • progettati per generare risultati sotto forma di contenuti, previsioni, raccomandazioni o decisioni che influenzano gli ambienti reali o virtuali con cui interagiscono;
  • che operano con un certo livello di autonomia e sono fortemente dipendenti dai dati.

Da queste caratteristiche è facile comprendere quanto sia determinante e rilevante la qualità dei dati utilizzati per addestrare gli algoritmi di IA.

A un’elevata qualità dei dati corrisponde un’elevata affidabilità dei sistemi.

Per cui, l’utilizzo di un set di dati duplicati, inesatti, incompleti o contenenti pregiudizi (i cc.dd. Bias) determinerà, certamente, rischi significativi per la salute e la sicurezza o per i diritti fondamentali delle persone.

Si pensi, ad esempio, ai danni che potrebbero derivare dall’uso di dati inesatti o incompleti nel settore della telemedicina o nella gestione della mobilità urbana. E ancora, non è difficile immaginare quanti risultati discriminatori ed escludenti possano derivare da sistemi sviluppati con datasets contenenti Bias.

In modo suggestivo, questa modalità di funzionamento è semplificata negli acronimi GIGO (Garbage In = Garbage Out) e RIRO (Rubbish In = Rubbish Out). E’ molto semplice: se si immette spazzatura come input, il sistema di IA restituirà spazzatura come output.

Come garantire una qualità elevata dei dati

Quanto descritto rende affatto evidente la necessità che ogni sistema di IA sia addestrato con dati di elevata qualità. Ciò significa che devono essere pertinenti, rappresentativi e privi di errori, nonché completi alla luce delle finalità previste. Devono, inoltre, essere gestiti in un quadro di trasparenza, accuratezza, robustezza e sorveglianza umana.

In concreto, i sistemi che utilizzeranno tali dati dovrebbero essere progettati e sviluppati in modo tale da garantire che il loro funzionamento sia sufficientemente trasparente. Tutti gli utenti dovrebbero, cioè, essere posti nelle condizioni di interpretare l’output del sistema e di utilizzarlo adeguatamente.

Le indicazioni contenute nella Proposta di Regolamento UE sull’IA (AI Act)

Adeguate indicazioni su come poter garantire una costante elevata qualità dei dati sono contenute proposta di Regolamento UE, finora approvato dal Parlamento Europeo [COM(2021) 206 final -2021/0106 (COD) – c.d. AI Act]. In generale, questa proposta stabilisce una solida metodologia per gestire i rischi connessi all’uso dei dati e dei sistemi di IA “ad alto rischio”.  Sono quelli che pongono rischi significativi per la salute e la sicurezza o per i diritti fondamentali delle persone.

In particolare, l’art. 17 della proposta dell’AI Act impone ai fornitori di sistemi di IA ad “alto rischio” di mettere in atto un sistema di gestione della qualità (un DQM: Data Quality Management) che garantisca la conformità alla normativa di settore.

Tale sistema deve essere documentato in modo sistematico e ordinato sotto forma di politiche, procedure e istruzioni scritte che devono comprendere anche sistemi e procedure per la gestione dei dati che devono prevedere almeno le operazioni riportate nella tabella seguente:

data quality

Conclusioni

Quanto evidenziato dimostra come, all’interno di una Smart City, l’affidabilità dei sistemi utilizzati sia strettamente correlata a una elevata mole di Urban Big Data che devono sempre essere esatti, pertinenti, completi, rappresentativi e privi di errori.

Certamente non è facile istituire un solido sistema di gestione. Occorrono fondi, competenze e tanta dedizione. Solo attraverso questi adempimenti i cittadini potranno beneficiare dei vantaggi e dei benefici offerti dalle nuove tecnologie che devono sempre essere sviluppate e gestite in conformità ai valori umani e ai diritti fondamentali delle persone.

Giuseppe Alverone