Site icon Techprincess

DALL-E 2, l’intelligenza artificiale che crea immagini partendo da parole

DALL-E 2, l’intelligenza artificiale che crea immagini partendo da parole thumbnail

Nell’estate del 2019 ci siamo tutti sbizzarriti con FaceApp. Ciascuno di noi ha di colpo scoperto come potrebbe essere il proprio volto e quello di parenti e amici da anziani. O come sarebbero potute essere le nostre fattezze da giovanissimi.

Da lì in poi, è stato un proliferare di app che hanno permesso di giocare in modo più o meno realistico con i nostri volti e in generale con le immagini, creando una sorta di realtà alternativa e grottesca. È stata ad esempio la volta di Evil be like, dove più che altro ci si divertiva con la combinazione del negativo di un fotogramma e con una didascalia. È poi toccato a Yassify, grazie al quale il suo giovane creatore ha diffuso memi con visi abbelliti in modo eccessivo, pacchiano.

Insomma: in tutti questi casi si tratta di strumenti che partono da un’immagine reale, e giocano a deformarla con intenti satirici.

DALL-E 2

Qualcosa di diverso e di più estremizzato fa DALL-E 2, progetto dal nome non troppo affabile. Che nasce da OpenAI, organizzazione non profit sull’intelligenza artificiale fondata da Elon Musk e Sam Altman. Ma che cos’è, e come funziona, DALL-E 2?

Cos’è DALL-E 2

Perché abbiamo detto che DALL-E 2 è qualcosa di più estremizzato rispetto a FaceApp e affini?

Perché con DALL-E 2 la creazione di immagini non parte più da fotografie ma da… parole. In che senso? Nel senso che le immagini mostrate, in questo caso, non esistono nella realtà, ma sono generate dall’intelligenza artificiale. E sono incredibilmente realistiche.

E questa è solo una delle due peculiarità di DALL-E 2. L’altra è data dal fatto che le immagini create partono da parole suggerite all’AI dagli esseri umani.

Libero sfogo alla fantasia

Nel sito ufficiale è spiegato sinteticamente cosa è DALL-E 2. “È un nuovo sistema di intelligenza artificiale in grado di creare immagini e opere d’arte realistiche da una descrizione in linguaggio naturale.”

Vogliamo immaginare, e quindi suggerire all’intelligenza artificiale, un astronauta che approda sulla superficie lunare, ma in sella a un cavallo? Benissimo: sul sito del progetto sono mostrate diversi fotogrammi sull’argomento.

È poi circolato il muso di un cagnolino che fissa la camera. Tutto normale, se non indossasse dolcevita e cappello da pittore.

Come funziona DALL-E 2

L’intelligenza artificiale di DALL-E 2 elabora dunque una richiesta formulata per iscritto.

C’è anche un versante per così dire artistico: il sistema, partendo ad esempio dalla raffigurazione di un’opera d’arte, è in grado di creare infinite variazioni. Come è mostrato sempre sul sito ufficiale partendo dalla Ragazza con l’orecchino di perla di Vermeer.

La ricerca scientifica alla base di DALL-E 2 si basa su due abilità. Intanto, quella per cui l’intelligenza artificiale capisce la relazione tra le parole suggerite e le immagini. Per riuscirci, OpenAI ha sviluppato il sistema Clip (Contrastive Learning-Image Pre-training), che addestra in parallelo due reti neurali su immagini e relative didascalie prese dalla Rete. C’è poi il momento della creazione delle immagini, attraverso la tecnica di diffusione. Ovvero, si producono immagini che abbiano la maggior relazione possibile con il testo da elaborare, e che siano coerenti e comprensibili per l’occhio umano.

Una seconda versione aggiornata

DALL-E 2 è la versione più avanzata di DALL-E, presentata nel gennaio del 2021. Sono migliorate la risoluzione (si passa da 256 x 256 pixel a 1024 x 1024 pixel) e i tempi di realizzazione delle immagini.

DALL-E 2 non è ancora disponibile perché ancora in via di sviluppo. Tuttavia, come si legge sul sito ufficiale, lo strumento vuole diffondere la mission di OpenAI. Che è quella “di creare un’intelligenza artificiale a beneficio dell’umanità.”

L’idea, come vi abbiamo raccontato in un altro articolo, avrebbe già un competitor. Pare infatti che anche Mark Zuckerberg stia pensando a un’intelligenza artificiale capace di creare mondi virtuali nel metaverso, basandosi su semplici descrizioni.

Offerta

I rischi dell’operazione

DALL-E 2 non è ancora disponibile e c’è chi parla già di almeno due tipi di rischi.

Il primo è legato all’estrema difficoltà di distinguere le immagini reali da quelle create dall’AI (con l’ulteriore e implicito rischio dell’appropriazione di foto di persone).

Il secondo è che anche questo strumento di intelligenza artificiale perpetrerebbe una cultura discriminatoria. In un articolo apparso su Vox, la giornalista Sigal Samuel fa notare che, ad esempio, le immagini prodotte suggerendo le parole “avvocato” e “assistente di volo” sono, relativamente, solo di uomini bianchi e di donne bianche.

Exit mobile version