Di recente il sistema di auto-tagging ottico di Google ha classificato come “Gorilla” alcuni ragazzi di colore, e Google รจ finito in un polverone di accuse di razzismo. Google ha aderito al Ku Klux Klan o la faccenda รจ differente? Sveliamo il mistero…
Il razzismo รจ una questione molto delicata oggi giorno e basta veramente poco ad essere etichettati razzisti, nonย era difficile perciรฒ immaginare cosa sarebbe accaduto dopo che alcuni ragazzi di colore si sono visti etichettare come “scimmie” da Google.
Milioni di testate giornalistiche da tutto il mondo non si sono fatte certo attendere ed ecco comparire articoli su articoli pronti a urlare allo scandalo.
Quel che molti non sanno รจ che a differenza della ricerca testuale, l’identificazione ottica รจ una faccenda molto piรน complessa. Gli algoritmi di computer vision non lavorano sull’immagine nello stesso identico modo in cui lavora il cervello umano (anche se con le CNN piรน evolute si stanno facendo enormi passi in avanti verso tale direzione), ma usano spesso strategie di “feature detection” piรน semplici. Ossia vengono estrapolati dei particolari significativi dell’immagine le “feature” e si cerca una corrispondenza con le feature identificate in un’altra immagine. Maggiore sarร il numero di corrispondenze tra le varie feature, maggiore sarร la probabilitร di avere effettivamente identificato l’immagine correttamente.
Il problema di questa strategia subentra quando a causa di particolari condizioni dell’immagine, come ad esempio bassa qualitร , particolari sovrapposizioni ecc. non รจ possibile identificare un alto numero di feature corrispondenti; in una tale situazione bastano ancheย pochi dettagli per trarre in inganno l’algoritmo, che prenderร si sempre l’immagine con un maggior numero di corrispondenze, ma se le corrispondenze sono troppo poche avranno poco significato e la probabilitร di errore sarร estremamente elevata.
In questo video effettuo un banale test esemplificativo utilizzando un software di ricerca su corrispondenza ottica che ho scritto in Matlab usando la tecnica SURF(una variante della Scale Invariant Feature Transform), usando come set d’immagini un repository con 51 foto prese a caso tra cui immagini di Parigi, foto di persone di varia etnia, e …immagini di gorilla.
Prima provoย a passare come immagine campione l’immagine dellaย Tourย Eiffel, poi riprovo usando l’immagineย dei due ragazziย che ha scatenato il polverone. Guardate qui cosa accade…