Dalla parola alle immagini, dall’idea alla sua realizzazione. Il tutto, sfruttando l’intelligenza artificiale. Questa è la promessa di Midjourney, intelligenza artificiale text-to-image capace di generare immagini partendo da un testo: cos’è e come funziona questo strumento? E come utilizzarlo per creare immagini con l’AI?
Cos’è e come funziona Midjourney, l’AI che genera immagini
Midjourney è un’intelligenza artificiale text-to-image, ovvero un sistema che usa algoritmi di deep learning per creare delle immagini realistiche a partire da una descrizione testuale. In pratica, basta scrivere cosa si vuole vedere e Midjourney lo genera in poco tempo. Si può scegliere il livello di dettaglio, il colore, lo stile e la composizione dell’immagine. Si possono anche combinare elementi diversi o modificare quelli esistenti. È come avere un esperto di grafica a propria disposizione, anche se non sempre il risultato sarà altrettanto preciso, e quasi mai altrettanto ben studiato.
Midjourney è stato creato da un laboratorio di ricerca indipendente con sede a San Francisco, fondato da David Holz, che aveva anche creato la società Leap Motion (specializzata in sensori e tracker per la realtà virtuale).
Midjourney è disponibile dal marzo 2022 attraverso il social Discord. Oggi esiste anche un sito attraverso cui accedere al bot. Attenzione però: dopo l’utilizzo dei primi 25 minuti di Gpu (l’«unità di misura» per la generazione delle immagini, un minuto equivale circa a una richiesta), bisogna sottoscrivere un abbonamento (il piano standard costa dieci dollari al mese, quello Pro 60 dollari al mese).
Prova Bitdefender. Leader in Cybersecurity
Come funziona Midjourney
Midjourney usa una rete neurale artificiale chiamata Generative Adversarial Network (GAN), che consiste in due moduli: un generatore e un discriminatore. Il generatore ha il compito di produrre le immagini a partire dal testo. Mentre il discriminatore ha il compito di valutare se le immagini sono realistiche o no. Il generatore cerca di ingannare il discriminatore, mentre il discriminatore cerca di riconoscere le immagini false. In questo modo, i due moduli si allenano a vicenda e migliorano le loro prestazioni.
Midjourney si basa su una versione avanzata di GAN chiamata CLIP+DALL-E+VQGAN, che combina tre componenti: CLIP (Contrastive Language-Image Pre-training), DALL-E (Deep Autoregressive Language Model for Image Generation) e VQGAN (Vector Quantized Generative Adversarial Network). CLIP è una rete neurale che associa le parole alle immagini in base alla loro somiglianza semantica. DALL-E è una rete neurale che genera le immagini a partire dalle parole usando un modello autoregressivo. VQGAN è una rete neurale che comprime le immagini in vettori discreti e ne migliora la qualità.
Per cosa utilizzare il generatore di immagini AI?
Midjourney è uno strumento molto potente e versatile per la generazione di immagini text-to-image. Può essere usato per scopi artistici, educativi, ludici o informativi. Può creare scene mai viste prima, combinare elementi in modi originali o modificare quelli esistenti. Può anche produrre immagini iperrealistiche che sembrano vere e proprie fotografie. Questo in particolare ha portato alla diffusione di diverse fake news, come quelle viste di recente con il giubbotto di Papa Francesco o il finto arresto di Donald Trump.
Tuttavia, Midjourney ha anche dei limiti e dei rischi. Innanzitutto, non sempre riesce a interpretare correttamente il testo o a rispettare le specifiche richieste dall’utente. A volte genera immagini sbagliate, incomplete o incoerenti. Serve quindi attenzione da parte degli utenti per utilizzarlo al meglio.
Come funziona Midjourney su Discord?
Discord è un’applicazione di comunicazione che permette di scambiare messaggi, chiamate e videochiamate con altre persone. È nata nel 2015 e ha avuto molto successo tra i videogiocatori, che la usano per coordinarsi e socializzare. Tra le sue funzionalità c’è anche la possibilità di creare dei bot, ovvero dei programmi che interagiscono con gli utenti tramite comandi scritti.
Uno di questi bot è Midjourney, che sfrutta l’intelligenza artificiale per generare immagini a partire da una descrizione testuale. Per usare Midjourney bisogna prima registrarsi a Discord e poi entrare nel suo server, dove si trovano diversi canali dedicati. Per accedere al server si può usare questo link di invito, che porta a una comunità di oltre 13 milioni di utenti interessati a questa tecnologia. Cliccate “Accetta l’invito”.
Usare Midjourney richiede diversi tentativi
Usare Midjourney non è però così semplice come sembra. Spesso occorre provare più volte per ottenere l’immagine desiderata, modificando la descrizione o i parametri. Molti artisti o professionisti del settore creativo usano Midjourney come fonte di ispirazione o come strumento per esplorare diverse opzioni.
Come riporta il Corriere della Sera, Jos Avery, un fotografo che ha pubblicato su Instagram dei ritratti fatti con l’intelligenza artificiale, per realizzare 200 foto, ha generato con Midjourney più di 13mila immagini.
Per provare Midjourney bisogna entrare in uno dei canali chiamati “Newbies“, che hanno un numero associato. Lì potete scrivere la propria descrizione nell’apposito spazio e attendere 60 secondi per vedere quattro possibili risultati.
Come scrivere il prompt
Per utilizzare Midjourney, dovete scrivere la vostra descrizione dopo il comando “/imagine” (senza le virgolette). La descrizione va fatta necessariamente in inglese. Non temete di aggiungere dettagli, anzi piuttosto scrivete più a lungo, per dare più materiale all’AI. Ma preparatevi, per ottenere quello che volete potreste dover ripetere il processo più volte.
Midjourney genera quindi quattro immagini, tutte piuttosto simili fra loro, ma con alcuni dettagli diversi. Potete ingrandire le immagini cliccando il pulsante (U), che significa “Upscaling“: ricordate che i numeri vanni in senso orario partendo da in alto a sinistra.
Potete inoltre cliccare (V) per vedere una nuova versione di un’immagine in particolare, oppure (Refresh) per avere quattro nuove immagini. Cliccando su Apri nel browser, potete salvare l’immagine come qualsiasi altra foto nel web.
I comandi extra a pagamento
Ci sono diverse possibilità extra per chi utilizza una delle versioni a pagamento. Per esempio potete utilizzare i comandi:
/fast = per creare un’immagine in modo più veloce
/private = per non mostrare agli altri utenti la nostra immagine
-h e -w = per dare le dimensioni precise dell’immagine
-ar = per scegliere il formato
-video = per chiedere di creare un video
-quality 2 o -quality 5 = per aumentare la qualità dell’immagine
-stylize625 o stylize1250 (e poi ancora 2500, 20000 e 60000) = per decidere il livello artistico dell’immagine
Con queste opzioni extra avrete un controllo maggiore, ma alcune richiedono un pagamento extra oltre all’abbonamento.
Alcune regole e limiti
Visto l’utilizzo delle immagini di Midjourney per diffondere fake news, il team di sviluppo ha introdotto alcuni limiti. Per esempio, dopo il finto arresto di Donald Trump non potete chiedere immagini di persone famose in manette o in prigione. Ma potete ancora chiedere scontri fra personalità famose e tante altre immagini potenzialmente controverse. Aspettatevi però nuove regole e limiti in futuro: l’azienda che opera Midjourney sta ancora capendo come tarare le policy.
Ora dovreste avere un’idea più chiara di come funziona Midjourney e di come sfruttarlo su Discord. Ma come dicevamo, servirà la pratica – e tante immagini sbagliate – per poterlo sfruttare appieno.
Ultimo aggiornamento 2024-10-06 / Link di affiliazione / Immagini da Amazon Product Advertising API
Rimani aggiornato seguendoci su Google News!
Da non perdere questa settimana su Techprincess
🎮 Che impatto avranno le elezioni americane sui videogiochi?
🚘 I gadget più strani delle case automobilistiche
🇨🇳 Un gruppo di ricercatori cinesi ha sviluppato un modello di IA per uso militare basato su Llama di Meta
🔍 ChatGPT si aggiorna e ora naviga sul web
Ma lo sai che abbiamo un sacco di newsletter?
📺 Trovi Fjona anche su RAI Play con Touch - Impronta digitale!
🎧 Ascolta il nostro imperdibile podcast Le vie del Tech
💸E trovi un po' di offerte interessanti su Telegram!