Baidu ha annunciato un ulteriore sviluppo riguardo al suo software per il riconoscimento vocale. Il nuovo programma risulterebbe in grado di clonare le voci dopo aver analizzato una clip audio, qualcosa di non nuovo nel panorama dei programmi audio. Tuttavia la novità questa volta sta nella lunghezza della clip da analizzare che, secondo Baidu, può anche essere lunga solo un secondo. Il software utilizza una rete neurale e dunque una sorta di intelligenza artificiale per analizzare l’audio. Oltre a clonare la voce, può anche cambiarla (ad esempio per applicare un accento diverso). I progressi nel campo dei programmi di riconoscimento vocale e soprattutto di quelli che vanno a coronare le voci stanno facendo passi da gigante negli ultimi anni, segno del fatto che le possibilità computazionali delle nuove reti computerizzate sono sempre più alte. Diversi esempi audio, realizzato con questo sistema, possono essere trovati qui.

Fonte ed altri link: https://notiziescientifiche.it

 


 

We use cookies

Utilizziamo i cookie sul nostro sito Web. Alcuni di essi sono essenziali per il funzionamento del sito, mentre altri ci aiutano a migliorare questo sito e l'esperienza dell'utente (cookie di tracciamento). Puoi decidere tu stesso se consentire o meno i cookie. Ti preghiamo di notare che se li rifiuti, potresti non essere in grado di utilizzare tutte le funzionalità del sito.