OpenAI ha svelato i nuovi modelli o3 e o3-mini, un passo avanti significativo nel panorama dell’intelligenza artificiale. In concomitanza con l’annuncio, l’azienda ha aperto le candidature per consentire alla comunità dei ricercatori di testare questi sistemi in una fase di accesso anticipato. I ricercatori interessati possono trovare le domande di partecipazione nel post ufficiale sul blog di OpenAI.
Prestazioni preliminari e progressi
Durante un livestream dedicato, OpenAI ha condiviso le prime valutazioni sui nuovi modelli o3 e o3-mini, confrontandoli con le precedenti versioni o1 e o1-mini. Sebbene le versioni attuali siano ancora in fase di sviluppo e potranno evolversi con ulteriori processi di post-training, i risultati preliminari sono estremamente promettenti. I progressi si riflettono soprattutto nei benchmark matematici e nelle tecniche di sicurezza avanzate.
I punti salienti:
- Codifica eccezionale: o3 supera o1 di 22,8 punti percentuali nel benchmark SWE-Bench Verified e ottiene un punteggio Codeforces di 2727, superando il risultato di 2665 del Chief Scientist di OpenAI.
- Matematica e scienze: o3 si distingue con un punteggio del 96,7% in AIME 2024, mancando una sola domanda, e raggiunge l’87,7% in GPQA Diamond, superando di gran lunga le prestazioni di esperti umani.
- Benchmark avanzati: o3 stabilisce nuovi record risolvendo il 25,2% dei problemi su Frontier Math di EpochAI, dove nessun altro modello aveva mai superato il 2%. Nel test ARC-AGI, o3 triplica il punteggio di o1 nella categoria low compute e supera l’85%, come verificato in diretta dal team dell’ARC Prize.
Sicurezza e allineamento
Parallelamente al lancio di o3 e o3-mini, OpenAI ha pubblicato una ricerca sull’allineamento deliberativo, una tecnica innovativa che ha già giocato un ruolo cruciale nell’allineamento di o1, considerato finora il modello più robusto e sicuro dell’azienda. Questa nuova tecnica punta a migliorare ulteriormente la sicurezza e a garantire un allineamento rigoroso con i principi etici e operativi dell’IA.
Con il progredire delle capacità dell’intelligenza artificiale, OpenAI conferma il proprio impegno a collaborare con la comunità di ricerca per esplorare e perfezionare queste tecnologie. I ricercatori sono invitati a partecipare attivamente alla sperimentazione dei modelli o3 e o3-mini, contribuendo a plasmare il futuro dell’IA in modo sicuro e responsabile.
Ultimo aggiornamento 2024-10-06 / Link di affiliazione / Immagini da Amazon Product Advertising API
Rimani aggiornato seguendoci su Google News!
Da non perdere questa settimana su Techprincess
🎁 La guida ai regali di Natale di Techprincess
🏆 I prodotti tech più interessanti del 2024
🎮 Quale console acquistare a fine 2024?
🕹️ Tutti i trailer e gli annunci dei Game Awards 2024
📰 Ma lo sai che abbiamo un sacco di newsletter?
📺 Trovi Fjona anche su RAI Play con Touch - Impronta digitale!
🎧 Ascolta il nostro imperdibile podcast Le vie del Tech
💸E trovi un po' di offerte interessanti su Telegram!