Responsible AI, IBM rilascia i suoi dataset per riconoscimento facciale

Lo sviluppo di una responsible AI , cioè etica, è un dovere di tutti gli operatori del settore: IBM ha messo a disposizione della comunità 1 milione di immagini codificate

30 Gen 2019

Lo sviluppo di una responsible AI , cioè etica, è un dovere di tutti gli operatori del settore: IBM ha messo a disposizione della comunità 1 milione di immagini codificate

Autore

donatella cambosu

Tags

Una delle sfide che oggi pongono le tecnologie di intelligenza artificiale riguarda il campo che è stato denominato responsible AI, cioè ‘intelligenza artificiale responsabile’. Come possiamo essere sicuri che i software di artificial intelligence siano etici e liberi dai pregiudizi che, anche inconsapevolmente, i programmatori possono trasmettere? Come descrive questo articolo di AI4Business, il problema è che i software alla base delle applicazioni e servizi di AI non nascono da soli, ma sono preparati da qualcuno: più precisamente, i sistemi di apprendimento automatico hanno bisogno di dati “annotati” da esseri umani (supervised learning) o quantomeno selezionati e preparati (unsupervised learning). Il punto è che, essendo preparati da persone in carne e ossa, rischiano di portarsi dietro gli errori o i pregiudizi (bias) introdotti anche involontariamente dai progettisti, replicandoli in ogni futura applicazione. Un caso esplicativo di questo rischio è quanto effettivamente già successo nel sistema giudiziario statunitense, dove sono stati impiegati dei software di AI con l’obiettivo di prevedere quali individui più di altri rischiano di essere “futuri criminali”: l’analisi successiva ha messo in evidenza la presenza di bias/pregiudizi nei confronti di individui di colore. Assicurare lo sviluppo di ‘responsible AI’ è dunque oggi fondamentale per una ‘responsible company’ e lo spirito di collaborazione, la condivisione di dati, principi, approcci è altrettanto fondamentale affinchè lo sviluppo dell’intelligenza artificiale responsabile viaggi di pari passo con lo sviluppo delle applicazioni. IBM, all’avanguardia in ambito AI, si muove in questa direzione: IBM Research a seguito di uno studio ha rilasciato un nuovo set di dati inedito chiamato Diversity in Faces (DiF) per promuovere uno studio più corretto ed accurato nell’ambito della tecnologia di riconoscimento facciale: 1 milione di immagini con annotazioni utili ad aiutare la comunità scientifica a rilevare, riconoscere e analizzare meglio le immagini dei volti. Le immagini, rilasciate con licenza Creative Commons YFCC-100M, quindi pubblicamente disponibili, codificano le immagini usando 10 schemi di codifica ben stabiliti e indipendenti, tra cui craniofacciale (ad esempio, lunghezza della testa, lunghezza del naso, altezza della fronte), rapporti facciali (simmetria), visiva attributi (età, genere) e posa e risoluzione, oltre ad altri. I volti umani presenti in tutto il mondo sono molto differenti tra loro. Lo studio efficace della diversità di volti per la tecnologia di riconoscimento facciale è quindi molto complesso e deve andare ben oltre gli attributi tipici studiati come età, sesso e colore della pelle. Simmetria facciale, contornatura, distanza tra il naso e la fronte sono tutti attributi aggiuntivi che costituiscono la diversità nei nostri volti. La ricerca condotta da IBM contribuirà ad ampliare la conoscenza in materia. Il set di dati DiF, Diversity in Faces, è quindi un punto di partenza utile perché la ricerca globale possa studiare e sviluppare una soluzione di intelligenza artificiale più corretta ed accurata. Ricerca a dataset sono disponibili a questo indirizzo.