fbpx
NewsSoftwareTech

OpenAI lancia dataset multilingue per valutare l’AI in tutto il mondo

OpenAI ha rilasciato un nuovo dataset multilingue per valutare le prestazioni dei modelli di linguaggio AI in 14 lingue diverse. Per un’intelligenza artificiale che parla più lingue, non solamente l’inglese.

OpenAI presenta un dataset multilingue per valutare l’AI in 14 lingue diverse

Il dataset, chiamato Multilingual Massive Multitask Language Understanding (MMMLU), è stato condiviso sulla piattaforma Hugging Face. Rappresenta un’evoluzione del popolare benchmark MMLU, che testava le conoscenze dei sistemi di IA in 57 discipline, ma solo in inglese. Il nuovo MMMLU, invece, include lingue come arabo, tedesco, ma anche swahili, bengalese e yoruba. Alcune di queste hanno risorse limitate per l’addestramento dell’IA, rendendo il benchmark particolarmente significativo.

Come riporta VentureBeat, OpenAI ha utilizzato traduttori professionisti per creare il dataset MMMLU. Questo permette di garantire una maggiore precisione rispetto ai dataset che si affidano alla traduzione automatica. Questa scelta è cruciale per settori come sanità, diritto e finanza, dove anche piccoli errori di traduzione possono avere gravi conseguenze.

ChatGPT OpenAI dataset multilingue

Rilasciando il dataset su Hugging Face, una popolare piattaforma per la condivisione di modelli e dataset di machine learning, OpenAI coinvolge la più ampia comunità di ricerca sull’IA. Questa mossa permetterà a tantissimi utenti di testare l’intelligenza artificiale, in diverse lingue e in tutto il mondo.

Il focus del dataset su argomenti professionali e accademici permette di testare l’AI anche ad aziende nei settori legale, educativo e della ricerca. Tutti ambiti dove le differenze linguistiche sono particolarmente importanti.

Parallelamente al rilascio del dataset, OpenAI ha lanciato l‘OpenAI Academy. L’Academy fornirà formazione, supporto tecnico e 1 milione di dollari in crediti API per garantire l’accesso alle risorse di AI più avanzate.

Se volete testare il dataset multilingue, potete trovarlo su Hugging Face.

Offerta

Ultimo aggiornamento 2024-10-04 / Link di affiliazione / Immagini da Amazon Product Advertising API

Da non perdere questa settimana su Techprincess

💎Gli scienziati codificano il genoma umano su un cristallo di memoria 5D
 
🥽Ho vestito i panni di un bambino autistico
 
🎮PlayStation festeggia 30 anni con un’edizione speciale della PS5 ispirata all’iconica prima console
 
💳Il terribile malware che sfrutta l’NFC degli smartphone per clonare le carte di credito
 
🎧 Ma lo sai che abbiamo un sacco di newsletter?
 
📺 Trovi Fjona anche su RAI Play con Touch - Impronta digitale!
 
💌 Risolviamo i tuoi problemi di cuore con B1NARY
 
🎧 Ascolta il nostro imperdibile podcast Le vie del Tech
 
💸E trovi un po' di offerte interessanti su Telegram!

Source
Venture Beat

Autore

  • Stefano Regazzi

    Il battere sulla tastiera è la mia musica preferita. Nel senso che adoro scrivere, non perché ho una playlist su Spotify intitolata "Rumori da laptop": amo la tecnologia, ma non fino a quel punto! Lettore accanito, nerd da prima che andasse di moda.

    Visualizza tutti gli articoli

Ti potrebbero interessare anche:

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Back to top button