Riuscite a immaginare un gatto grigio? Bene. Ora, immaginatelo con il pelo bianco. Ora, immaginatelo camminare sulla Grande Muraglia cinese. Fatto? Ecco, in questi istanti una rapida serie di attivazioni neuronali nel vostro cervello ha prodotto variazioni dell’immagine presentata, in base alla vostra precedente conoscenza del mondo.
Facile immaginare, per noi esseri umani. Per un’intelligenza artificiale è tutta un’altra storia, invece. Nonostante i progressi nelle reti neurali, che eguagliano o superano le prestazioni umane in determinate attività, i computer sono ancora lontani dall’abilità umana di immaginare delle cose.
Immaginare? Impossibile per una AI. Almeno fino a ieri.
Ora, un team di ricerca della USC ha sviluppato un’intelligenza artificiale che utilizza capacità simili a quelle umane per immaginare un oggetto mai visto prima con attributi diversi. Il documento, intitolato “Zero-Shot Synthesis with Group-Supervised Learning”, è stato pubblicato nel mese di maggio, e da allora è tutto un fiorire di ricerche collaterali.
“Siamo stati ispirati dalle capacità di generalizzazione visiva umana per cercare di simulare l’immaginazione umana nelle macchine”, dice l’autore principale dello studio Yunhao Ge. “Gli esseri umani possono separare le loro conoscenze apprese per attributi, ad esempio forma, posa, posizione, colore, e poi ricombinarle per immaginare un nuovo oggetto. Il nostro articolo tenta di simulare questo processo utilizzando le reti neurali”.
Il problema della generalizzazione dell’intelligenza artificiale
Supponiamo di voler creare un sistema di intelligenza artificiale che generi immagini di automobili. All’inizio forniamo all’algoritmo alcune immagini di un’automobile. Il compito sarebbe di generare molti tipi di auto, in qualsiasi colore, da più angolazioni. Questa è una sfida seria: creare reti neurali in grado di estrarre le regole sottostanti e applicarle a una vasta gamma di nuovi esempi mai visti prima. Le reti però oggi sono addestrate su caratteristiche campione, senza prendere in considerazione gli attributi di un oggetto.
In questo nuovo studio, i ricercatori hanno tentato di superare questa limitazione.
Il segreto? Si chiama districamento
Il lavoro del team di ricerca si è basato sull’applicazione di un metodo chiamato districamento. Il districamento può essere utilizzato per generare deepfake, ad esempio, sintetizzando nuove immagini e video che sostituiscono l’identità di una persona con un’altra persona, ma mantenendo il movimento originale.
Il nuovo approccio prende un gruppo di immagini campione, non un campione alla volta come gli algoritmi tradizionali. Dd estrae la somiglianza tra di loro per ottenere qualcosa chiamato “apprendimento di rappresentazione districato controllabile”.
Quindi, ricombina questa conoscenza per ottenere una “nuova sintesi controllabile di immagini”. Potremmo usare il verbo “immaginare”.
È un processo davvero molto simile a come noi umani estrapoliamo: quando un umano vede il colore di un oggetto, possiamo facilmente applicarlo a qualsiasi altro oggetto sostituendo il colore originale con quello nuovo. Usando la tecnica del districamento, il gruppo ha generato un nuovo set di dati contenente 1,56 milioni di immagini che potrebbero aiutare la ricerca futura nel campo.
Immaginare aiuta a capire il mondo
Sebbene il districamento non sia un’idea nuova, i ricercatori affermano che la loro struttura può essere compatibile con quasi tutti i tipi di dati o conoscenze. Questo amplia le opportunità per le applicazioni.
Nel campo della medicina, ad esempio, il districamento potrebbe aiutare medici e biologi a scoprire farmaci più utili separando la funzione medica da altre proprietà e quindi ricombinandole per sintetizzare nuova medicina. Riuscire a far “immaginare” le macchine potrebbe anche aiutare a creare un’intelligenza artificiale più sicura. Ad esempio consentendo ai veicoli autonomi di immaginare ed evitare scenari pericolosi mai visti prima durante l’addestramento.
“Il deep learning ha già dimostrato prestazioni e promesse insuperabili in molti campi. Troppo spesso, però, ciò è avvenuto attraverso un mimetismo superficiale e senza una comprensione più profonda degli attributi separati che rendono ogni oggetto unico”, ha affermato Laurent Itti, professore di informatica . “Questo nuovo approccio di districamento, per la prima volta, scatena davvero un nuovo senso di immaginazione nei sistemi di intelligenza artificiale, avvicinandoli alla comprensione umana del mondo”.