Gli esperti di Google Research e dell’Università Ebraica di Gerusalemme hanno sviluppato Dreamix, un software che può usare qualsiasi materiale per creare video che corrispondono a delle istruzioni di testo. Un altro passo avanti dell’intelligenza artificiale generativa nel presidio di tutte le forme di espressione (dopo testi, immagini e audio). La particolarità di Dreamix è che non si limita alle istruzioni di testo, ma accetta anche foto o video di riferimento per una migliore adattabilità alle idee degli utenti.
Tre modalità operative a partire da istruzioni di testo, immagini, clip
A partire da immagini, clip o istruzioni di testo, Dreamix mette a disposizione tre funzionalità principali: editing video, generazione di video da immagini e generazione basata sul soggetto.
Con l’editing video, Dreamix può facilmente riprodurre i video di input e sostituire gli elementi con i tuoi oggetti preferiti. Ad esempio, puoi caricare la clip di una persona che taglia un frutto, e chiedere all’intelligenza artificiale di sostituire il frutto con una fetta di torta. Si possono fornire alcune riprese di un campo di grano e creare uno scenario più drammatico. Come sempre, faccio prima a mostrarvi le clip dei due esempi.
Dreamix è in grado di produrre video a partire da immagini (e/o istruzioni di testo). In questo esempio, l’intelligenza artificiale ha trasformato un’immagine statica in un’opera dinamica, inserendo uno squalo che nuota e facendo muovere la tartaruga. La posizione e lo sfondo sono stati mantenuti fedeli all’immagine originale, mentre la direzione della tartaruga è stata cambiata.
L’ultima delle tre funzioni consente a Dreamix di creare video animati a partire da una piccola raccolta di immagini che mostrano lo stesso soggetto. Ad esempio, se si forniscono a questa AI alcune immagini di un pompiere giocattolo, questa estrae le caratteristiche visive del soggetto e le anima in modo che il soggetto possa compiere azioni definite in istruzioni di testo.
In sintesi
Questa tecnologia potrebbe rappresentare una svolta per i creativi che non si basano solo sul linguaggio verbale, ma che sono anche ispirati dall’arte visiva. Al momento i risultati sembrano ancora molto incerti, ma dimostrano comunque la capacità dell’AI di comprendere le istruzioni di testo, e il contesto delle immagini di input.
Dreamix potrà essere un valido aiuto per velocizzare la creazione di storyboard o generare illustrazioni di riferimento. Al momento non è accessibile al pubblico (e ci chiediamo se Google ne farà uno degli “alfieri” per rispondere a ChatGPT), tuttavia non ci vorrà molto per vedere questo o altri strumenti simili sviluppati da società diverse.
L’intelligenza artificiale generativa è destinata a dire la sua anche con tv e cinema. Volete altri esempi? Qui c’è tutta la presentazione.