Ecco DALL-E 2, l’AI che crea immagini partendo da parole...

DALL-E 2, l’intelligenza artificiale che crea immagini partendo da parole thumbnail

Nell’estate del 2019 ci siamo tutti sbizzarriti con FaceApp. Ciascuno di noi ha di colpo scoperto come potrebbe essere il proprio volto e quello di parenti e amici da anziani. O come sarebbero potute essere le nostre fattezze da giovanissimi.

Da lì in poi, è stato un proliferare di app che hanno permesso di giocare in modo più o meno realistico con i nostri volti e in generale con le immagini, creando una sorta di realtà alternativa e grottesca. È stata ad esempio la volta di Evil be like, dove più che altro ci si divertiva con la combinazione del negativo di un fotogramma e con una didascalia. È poi toccato a Yassify, grazie al quale il suo giovane creatore ha diffuso memi con visi abbelliti in modo eccessivo, pacchiano.

Insomma: in tutti questi casi si tratta di strumenti che partono da un’immagine reale, e giocano a deformarla con intenti satirici.

DALL-E 2

Qualcosa di diverso e di più estremizzato fa DALL-E 2, progetto dal nome non troppo affabile. Che nasce da OpenAI, organizzazione non profit sull’intelligenza artificiale fondata da Elon Musk e Sam Altman. Ma che cos’è, e come funziona, DALL-E 2?

Cos’è DALL-E 2

Perché abbiamo detto che DALL-E 2 è qualcosa di più estremizzato rispetto a FaceApp e affini?

Perché con DALL-E 2 la creazione di immagini non parte più da fotografie ma da… parole. In che senso? Nel senso che le immagini mostrate, in questo caso, non esistono nella realtà, ma sono generate dall’intelligenza artificiale. E sono incredibilmente realistiche.

E questa è solo una delle due peculiarità di DALL-E 2. L’altra è data dal fatto che le immagini create partono da parole suggerite all’AI dagli esseri umani.

Libero sfogo alla fantasia

Nel sito ufficiale è spiegato sinteticamente cosa è DALL-E 2. “È un nuovo sistema di intelligenza artificiale in grado di creare immagini e opere d’arte realistiche da una descrizione in linguaggio naturale.”

Vogliamo immaginare, e quindi suggerire all’intelligenza artificiale, un astronauta che approda sulla superficie lunare, ma in sella a un cavallo? Benissimo: sul sito del progetto sono mostrate diversi fotogrammi sull’argomento.

È poi circolato il muso di un cagnolino che fissa la camera. Tutto normale, se non indossasse dolcevita e cappello da pittore.

Come funziona DALL-E 2

L’intelligenza artificiale di DALL-E 2 elabora dunque una richiesta formulata per iscritto.

C’è anche un versante per così dire artistico: il sistema, partendo ad esempio dalla raffigurazione di un’opera d’arte, è in grado di creare infinite variazioni. Come è mostrato sempre sul sito ufficiale partendo dalla Ragazza con l’orecchino di perla di Vermeer.

La ricerca scientifica alla base di DALL-E 2 si basa su due abilità. Intanto, quella per cui l’intelligenza artificiale capisce la relazione tra le parole suggerite e le immagini. Per riuscirci, OpenAI ha sviluppato il sistema Clip (Contrastive Learning-Image Pre-training), che addestra in parallelo due reti neurali su immagini e relative didascalie prese dalla Rete. C’è poi il momento della creazione delle immagini, attraverso la tecnica di diffusione. Ovvero, si producono immagini che abbiano la maggior relazione possibile con il testo da elaborare, e che siano coerenti e comprensibili per l’occhio umano.

Una seconda versione aggiornata

DALL-E 2 è la versione più avanzata di DALL-E, presentata nel gennaio del 2021. Sono migliorate la risoluzione (si passa da 256 x 256 pixel a 1024 x 1024 pixel) e i tempi di realizzazione delle immagini.

DALL-E 2 non è ancora disponibile perché ancora in via di sviluppo. Tuttavia, come si legge sul sito ufficiale, lo strumento vuole diffondere la mission di OpenAI. Che è quella “di creare un’intelligenza artificiale a beneficio dell’umanità.”

L’idea, come vi abbiamo raccontato in un altro articolo, avrebbe già un competitor. Pare infatti che anche Mark Zuckerberg stia pensando a un’intelligenza artificiale capace di creare mondi virtuali nel metaverso, basandosi su semplici descrizioni.

Offerta

La cultura dell'intelligenza artificiale. Vita quotidiana e...

Elliott, Anthony (Autore)

I rischi dell’operazione

DALL-E 2 non è ancora disponibile e c’è chi parla già di almeno due tipi di rischi.

Il primo è legato all’estrema difficoltà di distinguere le immagini reali da quelle create dall’AI (con l’ulteriore e implicito rischio dell’appropriazione di foto di persone).

Il secondo è che anche questo strumento di intelligenza artificiale perpetrerebbe una cultura discriminatoria. In un articolo apparso su Vox, la giornalista Sigal Samuel fa notare che, ad esempio, le immagini prodotte suggerendo le parole “avvocato” e “assistente di volo” sono, relativamente, solo di uomini bianchi e di donne bianche.

Rimani aggiornato seguendoci su Google News!

Da non perdere questa settimana su Techprincess

🚪 La pericolosa backdoor di Linux, disastro sventato da un solo ricercatore
🎶Streaming Farms: il lato oscuro della musica, tra ascolti falsi e stream pompati
✈️Abbiamo provato DJI Avata 2: sempre più divertente!
✒️ La nostra imperdibile newsletter Caffellattech! Iscriviti qui
  🎧 Ma lo sai che anche Fjona ha la sua newsletter?! Iscriviti a SuggeriPODCAST!
  📺 Trovi Fjona anche su RAI Play con Touch - Impronta digitale!
  💌 Risolviamo i tuoi problemi di cuore con B1NARY
  🎧 Ascolta il nostro imperdibile podcast Le vie del Tech
  💸E trovi un po' di offerte interessanti su Telegram!

DALL-E 2, l’intelligenza artificiale che crea immagini partendo da parole

Nuovo progetto di OpenAI

DALL-E 2

Cos’è DALL-E 2

Libero sfogo alla fantasia

Come funziona DALL-E 2

Una seconda versione aggiornata

I rischi dell’operazione

Rimani aggiornato seguendoci su Google News!

Seguici!

Claudio Bagnasco

Lascia un commento Annulla risposta

Ario: veramente difficile fare peggio – La recensione

Razer Kishi Ultra: il controller che trasforma smartphone e tablet in console portatili

La recensione di Motorola Edge 50 Pro, uno stile unico

Nothing presenta gli auricolari Ear and Ear (a) con ChatGPT integrato

Apple e la sostenibilità ambientale: emissioni di gas serra ridotte del 55% rispetto al 2015

DALL-E 2

Cos’è DALL-E 2

Libero sfogo alla fantasia

Come funziona DALL-E 2

Una seconda versione aggiornata

I rischi dell’operazione

Rimani aggiornato seguendoci su Google News!

Seguici!

Claudio Bagnasco

Iscriviti alla newsletter

Meglio mail che tardi

WhatsApp interromperà il supporto a iOS 10 e 11

Gli sviluppatori italiani che raccontano storie su Nintendo Switch

Ti potrebbero interessare anche:

Per il Garante, ChatGPT violerebbe la normativa sulla privacy

ChatGPT ora parla e accetta immagini e foto

Il tormentone infinito: Sam Altman torna alla guida di OpenAI

OpenAI e Figure: stiamo davvero costruendo una società di robot?

Lascia un commento Annulla risposta

Ario: veramente difficile fare peggio – La recensione

Razer Kishi Ultra: il controller che trasforma smartphone e tablet in console portatili

La recensione di Motorola Edge 50 Pro, uno stile unico

Nothing presenta gli auricolari Ear and Ear (a) con ChatGPT integrato

Apple e la sostenibilità ambientale: emissioni di gas serra ridotte del 55% rispetto al 2015