Site icon Techprincess

OpenAI lancia dataset multilingue per valutare l’AI in tutto il mondo

OpenAI lancia dataset multilingue per valutare l'AI in tutto il mondo thumbnail

OpenAI ha rilasciato un nuovo dataset multilingue per valutare le prestazioni dei modelli di linguaggio AI in 14 lingue diverse. Per un’intelligenza artificiale che parla più lingue, non solamente l’inglese.

OpenAI presenta un dataset multilingue per valutare l’AI in 14 lingue diverse

Il dataset, chiamato Multilingual Massive Multitask Language Understanding (MMMLU), è stato condiviso sulla piattaforma Hugging Face. Rappresenta un’evoluzione del popolare benchmark MMLU, che testava le conoscenze dei sistemi di IA in 57 discipline, ma solo in inglese. Il nuovo MMMLU, invece, include lingue come arabo, tedesco, ma anche swahili, bengalese e yoruba. Alcune di queste hanno risorse limitate per l’addestramento dell’IA, rendendo il benchmark particolarmente significativo.

Come riporta VentureBeat, OpenAI ha utilizzato traduttori professionisti per creare il dataset MMMLU. Questo permette di garantire una maggiore precisione rispetto ai dataset che si affidano alla traduzione automatica. Questa scelta è cruciale per settori come sanità, diritto e finanza, dove anche piccoli errori di traduzione possono avere gravi conseguenze.

Rilasciando il dataset su Hugging Face, una popolare piattaforma per la condivisione di modelli e dataset di machine learning, OpenAI coinvolge la più ampia comunità di ricerca sull’IA. Questa mossa permetterà a tantissimi utenti di testare l’intelligenza artificiale, in diverse lingue e in tutto il mondo.

Il focus del dataset su argomenti professionali e accademici permette di testare l’AI anche ad aziende nei settori legale, educativo e della ricerca. Tutti ambiti dove le differenze linguistiche sono particolarmente importanti.

Parallelamente al rilascio del dataset, OpenAI ha lanciato l‘OpenAI Academy. L’Academy fornirà formazione, supporto tecnico e 1 milione di dollari in crediti API per garantire l’accesso alle risorse di AI più avanzate.

Se volete testare il dataset multilingue, potete trovarlo su Hugging Face.

Offerta

Ultimo aggiornamento 2024-10-06 / Link di affiliazione / Immagini da Amazon Product Advertising API

Exit mobile version