fbpx
AttualitàCulturaTech

DALL-E 2, l’intelligenza artificiale che crea immagini partendo da parole

Nuovo progetto di OpenAI

Nell’estate del 2019 ci siamo tutti sbizzarriti con FaceApp. Ciascuno di noi ha di colpo scoperto come potrebbe essere il proprio volto e quello di parenti e amici da anziani. O come sarebbero potute essere le nostre fattezze da giovanissimi.

Da lì in poi, è stato un proliferare di app che hanno permesso di giocare in modo più o meno realistico con i nostri volti e in generale con le immagini, creando una sorta di realtà alternativa e grottesca. È stata ad esempio la volta di Evil be like, dove più che altro ci si divertiva con la combinazione del negativo di un fotogramma e con una didascalia. È poi toccato a Yassify, grazie al quale il suo giovane creatore ha diffuso memi con visi abbelliti in modo eccessivo, pacchiano.

Insomma: in tutti questi casi si tratta di strumenti che partono da un’immagine reale, e giocano a deformarla con intenti satirici.

DALL-E 2

Qualcosa di diverso e di più estremizzato fa DALL-E 2, progetto dal nome non troppo affabile. Che nasce da OpenAI, organizzazione non profit sull’intelligenza artificiale fondata da Elon Musk e Sam Altman. Ma che cos’è, e come funziona, DALL-E 2?

openai

Cos’è DALL-E 2

Perché abbiamo detto che DALL-E 2 è qualcosa di più estremizzato rispetto a FaceApp e affini?

Perché con DALL-E 2 la creazione di immagini non parte più da fotografie ma da… parole. In che senso? Nel senso che le immagini mostrate, in questo caso, non esistono nella realtà, ma sono generate dall’intelligenza artificiale. E sono incredibilmente realistiche.

E questa è solo una delle due peculiarità di DALL-E 2. L’altra è data dal fatto che le immagini create partono da parole suggerite all’AI dagli esseri umani.

Libero sfogo alla fantasia

Nel sito ufficiale è spiegato sinteticamente cosa è DALL-E 2. “È un nuovo sistema di intelligenza artificiale in grado di creare immagini e opere d’arte realistiche da una descrizione in linguaggio naturale.”

Vogliamo immaginare, e quindi suggerire all’intelligenza artificiale, un astronauta che approda sulla superficie lunare, ma in sella a un cavallo? Benissimo: sul sito del progetto sono mostrate diversi fotogrammi sull’argomento.

È poi circolato il muso di un cagnolino che fissa la camera. Tutto normale, se non indossasse dolcevita e cappello da pittore.

Come funziona DALL-E 2

L’intelligenza artificiale di DALL-E 2 elabora dunque una richiesta formulata per iscritto.

C’è anche un versante per così dire artistico: il sistema, partendo ad esempio dalla raffigurazione di un’opera d’arte, è in grado di creare infinite variazioni. Come è mostrato sempre sul sito ufficiale partendo dalla Ragazza con l’orecchino di perla di Vermeer.

La ricerca scientifica alla base di DALL-E 2 si basa su due abilità. Intanto, quella per cui l’intelligenza artificiale capisce la relazione tra le parole suggerite e le immagini. Per riuscirci, OpenAI ha sviluppato il sistema Clip (Contrastive Learning-Image Pre-training), che addestra in parallelo due reti neurali su immagini e relative didascalie prese dalla Rete. C’è poi il momento della creazione delle immagini, attraverso la tecnica di diffusione. Ovvero, si producono immagini che abbiano la maggior relazione possibile con il testo da elaborare, e che siano coerenti e comprensibili per l’occhio umano.

Una seconda versione aggiornata

DALL-E 2 è la versione più avanzata di DALL-E, presentata nel gennaio del 2021. Sono migliorate la risoluzione (si passa da 256 x 256 pixel a 1024 x 1024 pixel) e i tempi di realizzazione delle immagini.

DALL-E 2 non è ancora disponibile perché ancora in via di sviluppo. Tuttavia, come si legge sul sito ufficiale, lo strumento vuole diffondere la mission di OpenAI. Che è quella “di creare un’intelligenza artificiale a beneficio dell’umanità.”

L’idea, come vi abbiamo raccontato in un altro articolo, avrebbe già un competitor. Pare infatti che anche Mark Zuckerberg stia pensando a un’intelligenza artificiale capace di creare mondi virtuali nel metaverso, basandosi su semplici descrizioni.

Offerta

I rischi dell’operazione

DALL-E 2 non è ancora disponibile e c’è chi parla già di almeno due tipi di rischi.

Il primo è legato all’estrema difficoltà di distinguere le immagini reali da quelle create dall’AI (con l’ulteriore e implicito rischio dell’appropriazione di foto di persone).

Il secondo è che anche questo strumento di intelligenza artificiale perpetrerebbe una cultura discriminatoria. In un articolo apparso su Vox, la giornalista Sigal Samuel fa notare che, ad esempio, le immagini prodotte suggerendo le parole “avvocato” e “assistente di volo” sono, relativamente, solo di uomini bianchi e di donne bianche.

Da non perdere questa settimana su Techprincess

🚪 La pericolosa backdoor di Linux, disastro sventato da un solo ricercatore
 
🎶Streaming Farms: il lato oscuro della musica, tra ascolti falsi e stream pompati
 
✈️Abbiamo provato DJI Avata 2: sempre più divertente!
 
✒️ La nostra imperdibile newsletter Caffellattech! Iscriviti qui 
  
🎧 Ma lo sai che anche Fjona ha la sua newsletter?! Iscriviti a SuggeriPODCAST!
  
📺 Trovi Fjona anche su RAI Play con Touch - Impronta digitale!
  
💌 Risolviamo i tuoi problemi di cuore con B1NARY
  
🎧 Ascolta il nostro imperdibile podcast Le vie del Tech
  
💸E trovi un po' di offerte interessanti su Telegram!

Claudio Bagnasco

Claudio Bagnasco è nato a Genova nel 1975 e dal 2013 vive a Tortolì. Ha scritto e pubblicato diversi libri, è co-fondatore e co-curatore del blog letterario Squadernauti. Prepara e corre maratone con grande passione e incrollabile lentezza. Ha raccolto parte delle sue scritture nel sito personale claudiobagnasco.com

Ti potrebbero interessare anche:

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Back to top button