Tencent annuncia la sua AI per creare video dalle immagini e dal testo

Stefano Regazzi

3 mesi fa

Tencent annuncia la sua AI per creare video dalle immagini e dal testo thumbnail

Il gigante cinese di Internet, Tencent, ha svelato la nuova versione del suo modello di intelligenza artificiale (AI) per la generazione video open source, DynamiCrafter. Un annuncio che arriva poco quello di Google per Lumiere, che svolge la stessa funzione. E sottolinea il fatto che la competizione tecnologica fra Stati Uniti e Cina è vivissima, anche per quanto riguarda l’AI.

Tencent annuncia l’AI per creare video

Tencent ha annunciato la novità su GitHub lunedì. Questa mossa conferma la crescente attenzione delle aziende tecnologiche cinesi nello spazio degli AI generativi, puntando sulla creazione di video partendo da immagini e testo — una vera avanguardia tecnologica.

LEGGI ANCHE: Google Bard ora può generare immagini con l’AI

DynamiCrafter, come altri strumenti video generativi, fa uso del metodo di diffusione, trasformando didascalie e immagini statiche in video della durata di pochi secondi. I modelli di diffusione consentono di trasformare dati semplici in dati più complessi e realistici, simile al movimento fisico delle particelle che si muovono da un’area ad alta concentrazione a un’area a bassa concentrazione. Funzionano così anche ChatGPT e Google Bard, sebbene gli algoritmi che abilitano questo effetto siano segreti ben custoditi.

Video da immagini o da poche parole

La nuova versione di DynamiCrafter genera video con una risoluzione in pixel di 640×1024, rappresentando un significativo aggiornamento rispetto alla versione precedente che produceva video 320×512. Un articolo accademico pubblicato dal team sottolinea la diversità di questa tecnologia rispetto ad altre simile. L’innovazione chiave sta nell’incorporare l’immagine nel processo generativo come guida. Questo contrasta con le tecniche tradizionali che si concentrano principalmente sull’animazione di scene naturali con dinamiche stocastiche o movimenti specifici del dominio.

In una demo comparativa tra DynamiCrafter, Stable Video Diffusion (lanciato a novembre) e Pika Labs (il video qui sopra), il modello Tencent appare leggermente più animato. Ma come fa notare TechCrunch, non si può che supporre che Tencent abbia scelto solo gli esempi che favoriscono il suo modello.

Scopri le migliori offerte della giornata sul canale Telegram di techprincess

Competizione crescente nell’ambito AI

L’AI ha dimostrato di saper generare con discreto successo testi e immagini. ChatGPT sta diventando sempre più una normalità nel mondo di lavoro, così come moltissimi utilizza l’AI per creare immagini. Ora, diverse aziende stanno investendo nei video generativi. E sembra che OpenAI e Google non saranno sole: anche in Cina si sta lavorando su questo versante.

A dimostrarlo, startup e aziende tecnologiche in Cina, tra cui ByteDance, Baidu e Alibaba, che hanno rilasciato i propri modelli di diffusione video. MagicVideo di ByteDance e UniVG di Baidu hanno pubblicato demo su GitHub, mentre Alibaba ha reso open source il suo modello VGen. La competizione sull’AI fra Stati Uniti e Cina sembra, insomma, più viva che mai. Come un video generato dall’intelligenza artificiale.

INTELLIGENZA ARTIFICIALE: 3 libri in 1. La più grande...

D. Gibson, Frank (Autore)