4 Luglio 2015 silviomarano

Google e il riconoscimento ottico razzista

Di recente il sistema di auto-tagging ottico di Google ha classificato come “Gorilla” alcuni ragazzi di colore, e Google è finito in un polverone di accuse di razzismo. Google ha aderito al Ku Klux Klan o la faccenda è differente? Sveliamo il mistero…
google_racist

scandalo_googleIl razzismo è una questione molto delicata oggi giorno e basta veramente poco ad essere etichettati razzisti, non era difficile perciò immaginare cosa sarebbe accaduto dopo che alcuni ragazzi di colore si sono visti etichettare come “scimmie” da Google.

Milioni di testate giornalistiche da tutto il mondo non si sono fatte certo attendere ed ecco comparire articoli su articoli pronti a urlare allo scandalo.

Quel che molti non sanno è che a differenza della ricerca testuale, l’identificazione ottica è una faccenda molto più complessa. Gli algoritmi di computer vision non lavorano sull’immagine nello stesso identico modo in cui lavora il cervello umano (anche se con le CNN più evolute si stanno facendo enormi passi in avanti verso tale direzione), ma usano spesso strategie di “feature detection” più semplici. Ossia vengono estrapolati dei particolari significativi dell’immagine le “feature” e si cerca una corrispondenza con le feature identificate in un’altra immagine. Maggiore sarà il numero di corrispondenze tra le varie feature, maggiore sarà la probabilità di avere effettivamente identificato l’immagine correttamente.

Il problema di questa strategia subentra quando a causa di particolari condizioni dell’immagine, come ad esempio bassa qualità, particolari sovrapposizioni ecc. non è possibile identificare un alto numero di feature corrispondenti; in una tale situazione bastano anche pochi dettagli per trarre in inganno l’algoritmo, che prenderà si sempre l’immagine con un maggior numero di corrispondenze, ma se le corrispondenze sono troppo poche avranno poco significato e la probabilità di errore sarà estremamente elevata.

In questo video effettuo un banale test esemplificativo utilizzando un software di ricerca su corrispondenza ottica che ho scritto in Matlab usando la tecnica SURF(una variante della Scale Invariant Feature Transform), usando come set d’immagini un repository con 51 foto prese a caso tra cui immagini di Parigi, foto di persone di varia etnia, e …immagini di gorilla.
Prima provo a passare come immagine campione l’immagine della Tour Eiffel, poi riprovo usando l’immagine dei due ragazzi che ha scatenato il polverone. Guardate qui cosa accade…

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Sviluppo software su misura

Entra in contato con me!

Translate »
www.000webhost.com