TEXT-TO-SPEECH – Google lança solução que permite aos clientes converter texto em mais de 32 vozes

Google Cloud expande seu portfólio de produtos em inteligência artificial e lança o Text-to-Speech, nova ferramenta que permite aos clientes a conversão de fala em texto em mais de 32 vozes em 12 idiomas diferentes, inclusive português.

Text-to-Speech do Google Cloud

Foto: Android Headlines

É a primeira vez que a empresa disponibiliza o WaveNet, um produto inovador de pesquisa de síntese de voz da DeepMind, para o público.

“Muitos produtos do Google como, por exemplo, o Google Assistant, Search e Maps, vêm com uma síntese de texto para fala incorporada, de alta qualidade, que produz fala com som natural. Os desenvolvedores nos disseram que gostariam de adicionar texto para voz a seus próprios aplicativos. Por isso, hoje estamos trazendo essa tecnologia para o Google Cloud Platform, com o Cloud Text-to-Speech”, declara Dan Aharon, gerente de produto de Google Cloud AI

Além de permitir que os usuários escolham entre 32 vozes diferentes de 12 idiomas, o Cloud Text-to-Speech também traz pronúncias mais assertivas em textos complexos, como nomes, datas, horários e endereços. O produto, já utilizado por empresas como Cisco e Dolphin ONE, permite a personalização do tom, a taxa de fala e o ganho de volume da voz, além de oferecer suporte a diversos formatos de áudio, incluindo MP3 e WAV.

Com o Cloud Text-to-Speech é possível selecionar vozes de alta fidelidade construídas com base no o WaveNet, um modelo generativo para áudio bruto criado pela DeepMind. O WaveNet traz uma fala mais natural, fazendo com que os usuários prefiram o seu áudio ao invés de outras tecnologias de conversão de texto em voz que já existem no mercado.

Mais informações sobre o produto podem ser encontradas na página da empresa. Para quem gostaria de experimentar a ferramenta, basta clicar aqui.

 


Informações:
Ketchum