skip to main | skip to sidebar
12 commenti

Google Brain “ricostruisce” le immagini mascherate con i quadrettoni

A prima vista è un risultato spettacolare: Google ha pubblicato una dimostrazione di un software in grado (almeno in apparenza) di ricostruire i dettagli di un volto mascherato usando la tecnica dei “quadrettoni”, come mostrato qui accanto. A sinistra c’è l’immagine mascherata, al centro c’è la ricostruzione e a destra c’è il volto originale.

In realtà la “ricostruzione” è un tentativo basato su un repertorio di immagini simili: non c’è nessuna garanzia che il volto ricostruito corrisponda all’originale, anche se gli somiglierà parecchio.

Il problema di questa tecnica è che crea l’illusione “alla CSI” che si possano ottenere ingrandimenti strabilianti dalle immagini più sgranate, come appunto ha fatto CSI in alcune puntate particolarmente inverosimili: questi miracoli continuano ad essere tecnicamente impossibili, ma c’è il rischio che un giudice o una giuria che fraintendono il funzionamento di questo nuovo software pensino di avere davanti agli occhi il volto reale di un sospettato. In circostanze meno drammatiche, comunque, quest’elaborazione potrebbe rendere più gradevoli le foto di famiglia sfuocate o sgranate. È proprio il caso di dire che staremo a vedere.
Invia un commento
I commenti non appaiono subito, devono essere tutti approvati da un moderatore. Lo so, è scomodo, ma è necessario per tenere lontani scocciatori, spammer, troll e stupidi: siate civili e verrete pubblicati qualunque sia la vostra opinione; gli incivili di qualsiasi orientamento non verranno pubblicati, se non per mostrare il loro squallore.
Inviando un commento date il vostro consenso alla sua pubblicazione, qui o altrove.
Maggiori informazioni riguardanti regole e utilizzo dei commenti sono reperibili nella sezione apposita.
NOTA BENE. L'area sottostante per l'invio dei commenti non è contenuta in questa pagina ma è un iframe, cioè una finestra su una pagina di Blogger esterna a questo blog. Ciò significa che dovete assicurarvi che non venga bloccata da estensioni del vostro browser (tipo quelle che eliminano le pubblicità) e/o da altri programmi di protezione antimalware (tipo Kaspersky). Inoltre è necessario che sia permesso accettare i cookie da terze parti (informativa sulla privacy a riguardo).
Commenti
Commenti (12)
Infatti il processo tramite il quale questi sistemi IA riescono a ricostruire i volti dalla matrice di pixel viene chiamato allucinazione, in pratica dopo aver mostrato alla rete neurale decine di migliaia di coppie immaginiHD-immaginiLD il software si fa un'idea di quale sia la famiglia di volti che se downscalata porta a quella specifica matrice di pixel 8x8 e ne immagina una. Perchè si parla di famiglia di volti? Perchè il downscale dell'immagine effettivamente fa perdere informazione e questa informazione non si può più recuperare. In ogni caso la vera innovazione è avere un programma intelligente che costruiesce un volto partendo da un'informazione quasi nulla. Questa tecnologia è una evoluzione del deep learning (che già è rivoluzionario) chiamata G.A.N. (Generative Adversarial Networks) ed è considerata dagli esperti come la più grande scoperta nel campo della IA da 20 anni a questa parte, principalmente perchè apre la strada all'unsupervised learning, che è indispensabile per realizzare delle A.G.I. (Artificial General Intelligence, intelligenze in grado di compiere qualasi compito e non solo l'unica funzione per cui sono programmate) A chi è interessato consiglio vivamente di leggersi questo articolo (per capire il grosso non serve alcuna conoscenza di matematica): https://arxiv.org/pdf/1701.00160.pdf
E' un'argomento interessantissimo e che stà avendo un vero e proprio sconvolgimento tellurico. In genere a leggere tutte queste notizie sulla IA si è portati a pensare che sia tutto hype, in realtà se si vanno a leggere gli articolo scientifici sull'argomento ci si rende conto che anche tra gli esperti l'entusiasmo è reale, siamo ancora lontani dalle cose descritte negli articoli giornalistici mondani ma i progressi fatit in questi ultimi anni sono entusiasmanti e sconvolgeranno ogni ambiente umano breve tempo potete contarci!
c’è il rischio che un giudice o una giuria che fraintendono il funzionamento di questo nuovo software?
no vi e' la certezza!
Pensiamo solo all'uso della PEC che viene considerata certificata...
La tecnica dei “quadrettoni” corrisponderebbe, in un certo senso, ad una compressione "lossy", cioè con perdita irreversibile di informazioni. Non vedo come un software possa recuperare da un'immagine dei dettagli che sono stati perduti.
C'è un progetto open source (neural-enhance) che fa una cosa simile sebbene partendo da immagini meno sgranate.
Il risultato ovviamente non sarà mai questo: https://www.youtube.com/watch?v=LhF_56SxrGk
immagino pensiamo tutti alla stessa cosa

(i porno made in japan, per capirci)
Ottima idea, però come dice l'articolo originale è più che altro un tentativo di assegnare l'immagine quadrettata ad una con risoluzione più alta. Non c'è garanzia di ottenere un risultato corretto.

Se fosse veramente possibile ricostruire l'immagine a partire dai quadrettazzi avremmo trovato la Pietra Filosofale dell'informatica perché ci permetterebbe di creare informazione dal nulla.

L'immagine 32x32 è ricostruita a partire dalla 8x8, ma potremmo applicare lo stesso algoritmo ad un'immagine 2x2 per ricostruire la 8x8, e quindi la 32x32. Ehi, un momento, ma perché non usare un'immagine 1x1 di partenza? Da questa ricostruiamo in cascata tutte le altre ed arriviamo alla 32x32... Quindi in un byte (se consideriamo un'immagine in scala di grigi) è codificata l'informazione di una faccia, ovvero... con i 256 valori possibili di un byte possiamo codificare tutte le facce del mondo, compresa quella di mia nonna, di Napoleone e del mio bisnipote. Troppo bello se fosse vero, purtroppo la matematica non è un'opinione e non può esserci una corrispondenza biunivoca tra un gruppo di 256 elementi e uno di alcuni miliardi.
Il primo volto dell'esempio infatti è molto diverso da quello reale.
Se il programma restituisce una sola potenziale immagine si può subire l'inganno che quella sia proprio l'immagine esatta, se invece fornisse cinque o sei differenti interpretazioni, allora si avrebbe più facilmente l'evidenza delle potenzialità e dei limiti del software e il giudice o chi per lui non sarebbe ingannato.
Comunque, non conosco lo stato dell'arte, ma ritengo fondamentale che i giudici che utilizzano la scienza forense abbiano una conoscenza buona di tutti i limiti e di tutte le potenzialità di ciascuna tecnologia.
sulla prima foto ha preso fischi per fiaschi... :)
puoi fare la stessa cosa strizzando leggermente gli occhi, il tuo cervello ricompone una pseudo immagine basata sui volti che ha in memoria...me ne ero accorto nel 95...ma comunque resta un immagine non affidabile sia quella elaborata del nostro cervello che quella dal software, se l'informazione non c'è non te la puoi inventare..
questi miracoli continuano ad essere tecnicamente impossibili, ma c’è il rischio che un giudice o una giuria che fraintendono il funzionamento di questo nuovo software pensino di avere davanti agli occhi il volto reale di un sospettato.

Difatti esiste "l'effetto CSI" e, da quel che leggo sulla en.wiki, dal 2005 negli USA la selezione dei giurati tiene conto del fatto che questi guardino o meno serie poliziesche e quanto credano a ciò che vedono fare da Grissom e soci. Non so quanto la notizia sia reale, quanto sia ancora attuale e se mai sia stato dimostrato che CSI possa aver influito negativamente in alcune sentenze di tribunale

Però è indubbio che quei telefilm abbiano influito sull'opinione pubblica...e non è il caso di andare all'estero per rendersene conto.
Basti pensare che, quando entrano in gioco i famosi R.I.S. di Parma, molti si aspettano che dopo 2-3 giorni arrivino i risultati dei loro rilievi. Oppure, quando ci fu il delitto di Garlasco, qualcuno gridò allo scandalo perchè il corpo della ragazza era stato spostato e qualcuno aveva inquinato la scena camminando sulle chiazze di sangue. Il problema è che noi siamo abituati al personaggio che vede un cadavere e dice "nessuno tocchi niente": nella realtà, chi vede un corpo esanime, cerca comunque di rianimarlo (e se non lo fa lui, lo fanno i medici che accorrono sul posto) e di certo non si preoccupano di dove mettono i piedi.
Forse sono un vecchio babbione, ma quello che chiamate "effetto CSI" per me si chiama "effetto Blade Runner". :D

Ecco cosa riusciva a tirare fuori da una foto il buon vecchio Rick Deckard:
https://www.youtube.com/watch?v=qHepKd38pr0

(non c'entra nulla, ma se attivate i sottotitoli automatici le risate sono assicurate)