Site icon Techprincess

Microsoft: intelligenza artificiale crea discorsi realistici

La conversione da testo a voce sta diventando sempre più intelligente, ma c’è un problema: può ancora richiedere molto tempo e risorse per produrre un risultato dal suono naturale. I ricercatori Microsoft e cinesi potrebbero avere un modo più efficace. Hanno creato un’intelligenza artificiale che può generare un discorso realistico utilizzando solo 200 campioni vocali (per un valore di circa 20 minuti) e trascrizioni corrispondenti.

L’intelligenza artificiale Microsoft imita le sinapsi umane

Il sistema si basa in parte su Transformer, ovvero reti neurali profonde che emulano approssimativamente i neuroni nel cervello. I trasformatori pesano ogni input e output al volo come fossero collegamenti sinaptici, aiutando ad elaborare sequenze anche lunghe in modo molto efficiente, ad esempio una frase complessa. Combinandolo con un componente encoder che rimuove il rumore e l’intelligenza artificiale si può fare molto con relativamente poco.

I risultati non sono perfetti, resta un leggero suono robotico, ma sono estremamente accurati con una intelligibilità delle parole del 99,84 percento. Ancora più importante, questo potrebbe rendere più accessibile il text-to-speech. Non si avrebbe bisogno di molti sforzi per ottenere voci realistiche, mettendole alla portata delle piccole aziende e persino dei dilettanti. Anche questo fa ben sperare per il futuro. I ricercatori sperano di allenarsi in modo migliore sui dati, quindi potrebbe richiedere ancora meno lavoro per creare un dialogo realistico con questa intelligenza artificiale targata Microsoft.

[amazon_link asins=’B07MNW1GRK,B07256GW4Z,B07QNYTMB6′ template=’ProductCarousel’ store=’gamspri02-21′ marketplace=’IT’ link_id=’cc85cd74-e2d9-4da7-b5da-4f0e35e5ccae’]
Exit mobile version