Logo Google Google.com

Google lancia Cloud Text-to-Speech, una nuova piattaforma di sintesi vocale

La compagnia di Mountain View continua a puntare al miglioramento della sintesi vocale, lanciando Cloud Text-to-Speech, una nuova piattaforma dedicata agli sviluppatori. Il servizio di Google consentirà agli stessi di implementare in app, siti o assistenti, una sofisticata tecnologia di sintesi vocale basata su AI.

Google punta sulla sintesi vocale con il nuovo servizio Cloud Text-to-Speech

google sintesi vocale

La piattaforma Cloud Text-to-Speech (attualmente in fase beta) è stata realizzata in collaborazione con DeepMind. Si tratta di un’azienda sussidiaria che si occupa di tecnologie AI. Il nuovo servizio sfrutta il software WaveNet, in grado di realizzare una sintesi vocale “più umana” e che sfrutta l’intelligenza artificiale ed il machine learning. Rispetto alla concatenative synthesis di Siri, WaveNet è capace di analizzare le onde sonore e compararle con un database di parole. I suoni vengono poi creati da zero alla velocità di 24 mila campioni al secondo. Tale soluzione – stando a quanto dichiarato da Google – è 1000 volte più veloce e produce 20 secondi di audio in un secondo.

google sintesi vocale

Ciliegina sulla torta per gli sviluppatori, Cloud Text-to-Speech permette di attingere da 32 tipologie di voce in 12 lingue. Altresì, è possibile personalizzare la velocità ed il volume dei file che vengono generati. Dopo aver testato le possibilità offerte da WaveNet con Assistant (già a partire dallo scorso ottobre, ma solo in inglese e giapponese), Google è pronta a condividere gli stessi servizi anche con sviluppatori di terze parti. Ricordiamo che si tratta ancora di una versione beta; maggiori informazioni sono disponibili nella pagina dedicata.

[su_app]