Basta un minuto per clonare una voce: l’intelligenza artificiale fa progressi
L'intelligenza artificiale rapidissima nell'analizzare e 'clonare' le voci umane: il programma Deep Voice di Baidu, il concorrente cinese di Google, è riuscito a farlo riducendo i tempi da mezz'ora a meno di un minuto. Il progetto dei ricercatori cinesi è quello di dare alle macchine una 'voce' più simile a quella umana quando parlano con l'uomo.
Per farlo, hanno insegnato alla macchina a trasformare un testo in parole con il timbro vocale di una persona, grazie ad un sistema basato su reti neurali, capace di riprodurre la voce di migliaia di persone con meno di mezz'ora di 'studio'. Prima si registrano i campioni di voce, per permettere al sistema di imparare a riconoscere la voce della persona, e poi gli si fa leggere un testo definito a voce alta con la voce del soggetto imitato. Partendo solo da poche frasi della durata di 5 secondi, hanno ottenuto un buon risultato in termini di somiglianza e naturalezza della voce.
Il sistema è in grado anche di imitare e manipolare la voce, aggiungendole accenti diversi a seconda della provenienza geografica o cambiandola come se fosse del sesso opposto. Questo sistema potrebbe essere utilizzato dalle persone che hanno perso l'uso della voce, ma non mancano i rischi di applicazioni poco lecite.
Per farlo, hanno insegnato alla macchina a trasformare un testo in parole con il timbro vocale di una persona, grazie ad un sistema basato su reti neurali, capace di riprodurre la voce di migliaia di persone con meno di mezz'ora di 'studio'. Prima si registrano i campioni di voce, per permettere al sistema di imparare a riconoscere la voce della persona, e poi gli si fa leggere un testo definito a voce alta con la voce del soggetto imitato. Partendo solo da poche frasi della durata di 5 secondi, hanno ottenuto un buon risultato in termini di somiglianza e naturalezza della voce.
Il sistema è in grado anche di imitare e manipolare la voce, aggiungendole accenti diversi a seconda della provenienza geografica o cambiandola come se fosse del sesso opposto. Questo sistema potrebbe essere utilizzato dalle persone che hanno perso l'uso della voce, ma non mancano i rischi di applicazioni poco lecite.