OpenAI ha rilasciato un nuovo dataset multilingue per valutare le prestazioni dei modelli di linguaggio AI in 14 lingue diverse. Per un’intelligenza artificiale che parla più lingue, non solamente l’inglese.
OpenAI presenta un dataset multilingue per valutare l’AI in 14 lingue diverse
Il dataset, chiamato Multilingual Massive Multitask Language Understanding (MMMLU), è stato condiviso sulla piattaforma Hugging Face. Rappresenta un’evoluzione del popolare benchmark MMLU, che testava le conoscenze dei sistemi di IA in 57 discipline, ma solo in inglese. Il nuovo MMMLU, invece, include lingue come arabo, tedesco, ma anche swahili, bengalese e yoruba. Alcune di queste hanno risorse limitate per l’addestramento dell’IA, rendendo il benchmark particolarmente significativo.
Come riporta VentureBeat, OpenAI ha utilizzato traduttori professionisti per creare il dataset MMMLU. Questo permette di garantire una maggiore precisione rispetto ai dataset che si affidano alla traduzione automatica. Questa scelta è cruciale per settori come sanità, diritto e finanza, dove anche piccoli errori di traduzione possono avere gravi conseguenze.
Rilasciando il dataset su Hugging Face, una popolare piattaforma per la condivisione di modelli e dataset di machine learning, OpenAI coinvolge la più ampia comunità di ricerca sull’IA. Questa mossa permetterà a tantissimi utenti di testare l’intelligenza artificiale, in diverse lingue e in tutto il mondo.
Il focus del dataset su argomenti professionali e accademici permette di testare l’AI anche ad aziende nei settori legale, educativo e della ricerca. Tutti ambiti dove le differenze linguistiche sono particolarmente importanti.
Parallelamente al rilascio del dataset, OpenAI ha lanciato l‘OpenAI Academy. L’Academy fornirà formazione, supporto tecnico e 1 milione di dollari in crediti API per garantire l’accesso alle risorse di AI più avanzate.
Se volete testare il dataset multilingue, potete trovarlo su Hugging Face.
Ultimo aggiornamento 2024-10-06 / Link di affiliazione / Immagini da Amazon Product Advertising API
Rimani aggiornato seguendoci su Google News!
Da non perdere questa settimana su Techprincess
🎮 Che impatto avranno le elezioni americane sui videogiochi?
🚘 I gadget più strani delle case automobilistiche
🇨🇳 Un gruppo di ricercatori cinesi ha sviluppato un modello di IA per uso militare basato su Llama di Meta
🔍 ChatGPT si aggiorna e ora naviga sul web
Ma lo sai che abbiamo un sacco di newsletter?
📺 Trovi Fjona anche su RAI Play con Touch - Impronta digitale!
🎧 Ascolta il nostro imperdibile podcast Le vie del Tech
💸E trovi un po' di offerte interessanti su Telegram!