fbpx
HotTech

OpenAI presenta Sora, IA che crea video (molto) realistici partendo da un testo

Lo strumento è in fase di test

Sono ore di gran fermento per l’intelligenza artificiale.

Google ha appena annunciato il suo nuovo modello Gemini 1.5, molto più potente rispetto alla precedente versione (e in fase di test l’azienda di Mountain View ne sta testando una con prestazioni di gran lunga maggiori). In un altro articolo vi abbiamo raccontato come OpenAI starebbe lavorando a un nuovo motore di ricerca basato sull’IA.

E proprio l’azienda di Sam Altman è uscita allo scoperto con una grossa novità. OpenAI ha lanciato Sora, intelligenza artificiale in grado di produrre video realistici (estremamente, realistici) partendo da un comando testuale. Cosa sappiamo dello strumento?

OpenAI annuncia Sora

A poche ore dall’annuncio di Gemini 1.5 sul blog di Google, tocca a OpenAI, che lancia Sora. E lo fa sapere al mondo attraverso un lungo post (piuttosto simile a una sezione del sito), che contiene una serie di filmati davvero suggestivi.

Anche la presentazione di Sora è magniloquente: “Stiamo insegnando all’intelligenza artificiale a comprendere e simulare il mondo fisico in movimento, con l’obiettivo di formare modelli che aiutino le persone a risolvere problemi che richiedono l’interazione nel mondo reale.

Ti presentiamo Sora, il nostro modello da testo a video. Sora può generare video della durata massima di un minuto mantenendo grande qualità visiva e la massima aderenza alla richiesta dell’utente.”

TechPrincess 1

Un esempio

Sora di OpenAI genera dunque video della durata massima di un minuto partendo da un testo.

La sezione del sito dedicata allo strumento riporta diversi video di esempio, ciascuno corredato dal prompt testuale utilizzato per produrlo. E il risultato è senza dubbio realistico. Un esempio: vediamo una giovane donna passeggiare di notte a Tokyo. È prima inquadrata a figura intera, poi in primo piano. Ecco, tradotto in italiano, il comando testuale che ha generato il video: “Una donna elegante cammina lungo una strada di Tokyo piena di neon caldi e luminosi e di segnaletica animata della città. Indossa una giacca di pelle nera, un lungo vestito rosso e stivali neri e porta una borsa nera. Indossa occhiali da sole e rossetto rosso. Cammina con sicurezza e disinvoltura. La strada è umida e riflette le figure, creando un effetto specchio delle luci colorate. Molti pedoni passeggiano.”

I video realistici di Sora

I video sinora mostrati da OpenAI indicano Sora come il più potente software generatore di video da comandi testuali.

Come si è evinto dal prompt appena citato, l’azienda spiega che “Sora è in grado di generare scene complesse con più personaggi, tipi specifici di movimento e dettagli accurati dei soggetti e dello sfondo. Il modello comprende non solo ciò che l’utente ha chiesto nel prompt, ma anche il modo in cui i diversi elementi coesistono nel mondo reale”.

Non è dato di sapere la data in cui OpenAI renderà disponibile Sora al pubblico. Per ora, Sam Altman ha lanciato un’iniziativa lungimirante dal punto di vista promozionale. Tramite il proprio account di X ha chiesto agli utenti di inviargli proposte di prompt testuali che vorrebbero vedere trasformati in video. Periodicamente, il Ceo di OpenAI li pubblicherà sul proprio profilo.

Ha già iniziato a farlo, e tra gli altri video si vede ad esempio “una sessione didattica di cucina per gnocchi fatti in casa condotta da una nonna influencer sui social media, ambientata in una cucina rustica toscana con illuminazione cinematografica.”

Qualità e limiti

La qualità dei video di Sora sposta di molto in là il livello rispetto a quanto visto finora. Sembrano preistoria le immagini deepfake di personaggi con sei dita nelle mani. Eppure, OpenAI ha dichiarato che “il modello attuale presenta dei punti deboli. Potrebbe avere difficoltà a simulare accuratamente i movimenti di una scena complessa e potrebbe non comprendere istanze specifiche di causa ed effetto. Ad esempio, una persona potrebbe dare un morso a un biscotto, ma in seguito il biscotto potrebbe non lasciare il segno del morso.

Il modello può anche confondere i dettagli spaziali di un prompt, ad esempio confondendo sinistra e destra, e può avere difficoltà con descrizioni precise di eventi che si verificano nel tempo, come seguire una specifica traiettoria della telecamera”.

Offerta

I rischi

In molti stanno pensando a un possibile utilizzo cinematografico di Sora. Ma sono ancora di più quelli che si stanno domandando se una simile straordinaria resa qualitativa dei video non renderà sempre più difficile la possibilità di distinguere il vero dal falso. Deepfake e disinformazione, con il boom dell’IA generativa, sono problemi sempre più urgenti e intricati.

In questo senso, sulla pagina dedicata a Sora ecco cosa dice OpenAI: “Coinvolgeremo politici, educatori e artisti di tutto il mondo per comprendere le loro preoccupazioni e identificare casi d’uso positivi per questa nuova tecnologia.

Nonostante ricerche e test approfonditi, non siamo in grado di prevedere tutti i modi positivi in cui le persone utilizzeranno la nostra tecnologia, né tutti i modi in cui ne abuseranno. Ecco perché crediamo che imparare dall’uso nel mondo reale sia una componente fondamentale per creare e rilasciare nel tempo sistemi di IA sempre più sicuri.”

Da non perdere questa settimana su Techprincess

🍎Nuovi iPad e accessori: cosa aspettarsi dall’evento Apple del 7 maggio
🍿Fallout: tutte le domande irrisolte alle quali la Stagione 2 dovrà rispondere
🛞Come scegliere gli pneumatici estivi per l’estate? I fattori da considerare
🤯Google licenzia 28 dipendenti per proteste contro il progetto Nimbus in Israele
✒️ La nostra imperdibile newsletter Caffellattech! Iscriviti qui 
🎧 Ma lo sai che anche Fjona ha la sua newsletter?! Iscriviti a SuggeriPODCAST!
📺 Trovi Fjona anche su RAI Play con Touch - Impronta digitale!
💌 Risolviamo i tuoi problemi di cuore con B1NARY
🎧 Ascolta il nostro imperdibile podcast Le vie del Tech
💸E trovi un po' di offerte interessanti su Telegram!

Claudio Bagnasco

Claudio Bagnasco è nato a Genova nel 1975 e dal 2013 vive a Tortolì. Ha scritto e pubblicato diversi libri, è co-fondatore e co-curatore del blog letterario Squadernauti. Prepara e corre maratone con grande passione e incrollabile lentezza. Ha raccolto parte delle sue scritture nel sito personale claudiobagnasco.com

Ti potrebbero interessare anche:

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Back to top button