fbpx
NewsSoftwareTech

OpenAI annuncia GPT-4, la nuova generazione dell’AI generativa

Ora il modello di linguaggio accetta anche input visivi

OpenAI ha finalmente rilasciato il suo nuovo modello di linguaggio AI, GPT-4. Questo modello rappresenta l’ultima evoluzione del sistema che alimenta la conversazione su app ormai note e utilizzate, tra cui ChatGPT e il nuovo Bing Chat.

OpenAI annuncia GPT-4, l’AI ora accetta anche input visivi

Secondo la società, GPT-4 rappresenta un significativo avanzamento rispetto ai suoi predecessori, fra cui il GPT-3.5 che moltissimi hanno utilizzato su ChatGPT e Bing Chat. Infatti, questa nuova versione offre un “maggiore livello di creatività e collaborazione“.

Inoltre, GPT-4 può analizzare sia l’input di testo che quello di immagini, anche se la sua risposta è limitata al solo testo. Tuttavia, OpenAI avverte che i sistemi conservano ancora molte delle problematiche dei modelli di linguaggio precedenti, tra cui l’invenzione di informazioni non presenti nella realtà (noto come “allucinazioni“) e la capacità di generare testo violento o dannoso. Quindi, resta l’avvertimento di utilizzarlo con attenzione.

Tante app già lo utilizzano

OpenAI ha collaborato con numerose aziende, tra cui Duolingo, Stripe e Khan Academy, per integrare GPT-4 nei loro prodotti. Il modello è disponibile per il pubblico tramite l’abbonamento mensile ChatGPT Plus di OpenAI, al prezzo di $20 al mese. Ma arriva anche ad alimentare il chatbot Bing di Microsoft.

ChatGPT Italia

Inoltre, GPT-4 sarà inoltre accessibile come API per gli sviluppatori che desiderano utilizzarlo per le proprie applicazioni. Ma c’è una lista di attesa per accedere all’API, che secondo OpenAI inizierà ad ammettere gli utenti oggi.

OpenAI avverte: GPT-4 è ancora “imperfetto e limitato”

In un post sul blog di ricerca, OpenAI ha affermato che la differenza tra GPT-4 e il suo predecessore, GPT-3.5 (il modello utilizzato da ChatGPT), è ridotta nelle conversazioni informali. Il CEO di OpenAI, Sam Altman, ha dichiarato su Twitter che GPT-4 è ancora un modello “imperfetto e limitato“. Ma che sembra ancora più impressionante al primo utilizzo e che diventa sempre più avanzato con l’utilizzo continuo.

L’azienda ha inoltre spiegato che il nuovo modello ha migliorato le perfomance dell’Uniform Bar Exam, il LSAT, il SAT Math e il SAT Evidence-Based Reading & Writing, sottolineando come sia uno dei migliori modelli in circolazione – per quanto imperfetto.

Un chatbot multimodale, ma meno flessibile del previsto

La scorsa settimana un dirigente di Microsoft ha lasciato trapelare che il sistema sarebbe stato rilasciato entro questa settimana, suggerendo che il sistema sarebbe stato multimodale. Quindi in grado di generare non solo testo ma anche altri tipi di media.

chatgpt

Sebbene OpenAI abbia confermato che GPT-4 è effettivamente multimodale, esso supporta meno tipi di media rispetto a quanto previsto. Il sistema è in grado di accettare input di testo e immagini, ma può produrre output di testo.

La capacità del modello di analizzare contemporaneamente testo e immagini gli consente di interpretare input più complessi. Negli esempi forniti dalla società, è possibile vedere il sistema che spiega meme e immagini insolite.

Un cammino continuo

La novità di GPT-4 quindi risulta piuttosto utile e migliora le prestazioni generali. Ma il team di OpenAI non vuole alimentare un hype insostenibile. L’azienda ha descritto il primo modello nel 2018, per poi lanciare GPT-2 nel 2019 e GPT-3 nel 2020. Ha quindi continuato ad analizzare tantissimi dati di testo, per istruire l’AI su come scrivere e rispondere in maniera più “umana” possibile.

L’azienda ha quindi accelerato i tempi, ma dopo aver lanciato GPT-3.5 nel 2022, le novità della nuova uscita possono risultare interessanti: ma non rivoluzionarie. OpenAI con GPT-4 vuole mantenere il vantaggio strategico che ha rispetto ai rivali (fra cui soprattutto Google con Bard). Ma comunque ha fatto passare il nuovo modello in “addestramento di sicurezza” per sei mesi, in modo da ridurre del 40% le risposte incorrette rispetto alla vecchia generazione.

La possibilità di inventare informazioni resta il limite più grande di questi modelli, ma sembra che OpenAI ne sia consapevole. E quindi non promette rivoluzioni – ma solo di rendere più preciso il proprio modello di linguaggio. Che senza dubbio, tutto internet testerà nelle prossime settimane: presto sapremo se il nuovo ChatGPT ha davvero ridotto le sue “allucinazioni”.

Da non perdere questa settimana su Techprincess

✒️ La nostra imperdibile newsletter Caffellattech! Iscriviti qui 
 
🎧 Ma lo sai che anche Fjona ha la sua newsletter?! Iscriviti a SuggeriPODCAST!
 
📺 Trovi Fjona anche su RAI Play con Touch - Impronta digitale!
 
💌 Risolviamo i tuoi problemi di cuore con B1NARY
 
🎧 Ascolta il nostro imperdibile podcast Le vie del Tech
 
💸E trovi un po' di offerte interessanti su Telegram!

Stefano Regazzi

Il battere sulla tastiera è la mia musica preferita. Nel senso che adoro scrivere, non perché ho una playlist su Spotify intitolata "Rumori da laptop": amo la tecnologia, ma non fino a quel punto! Lettore accanito, nerd da prima che andasse di moda.

Ti potrebbero interessare anche:

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Back to top button