Buscar

Abre campo para uso da voz


Inteligência Artificial.

Conversão de texto em fala: é o futuro da narração?


Boa notícia para os locutores. A popularização do serviço de transformar texto para voz (TTS em inglês: text to speech), dirigidas à inteligência artificial, está começando a fazer pensar se ainda precisamos de um ator ou dublador para narrar vídeos online ou material EAD ? Será necessário tanta interpretação ou apenas uma voz adequada

a seu produto/texto?


O que é exatamente conversão de texto em fala?

A conversão de texto em fala é a tecnologia auxiliar que transforma as frases em fala artificial. Ao fazer isso, ele produz uma versão falada de um texto virtual que imita a fala humana. É rápido, econômico e fácil de fazer. É a maneira mais eficaz de alcançar pessoas com dificuldades de leitura, de visão ou problemas de aprendizado.


Atualmente as opções disponíveis para você podem ser frustrantes porque são de alcance limitado. Portanto, dependendo do seu negócio e do objetivo da narração, o TTS pode não lhe servir bem enquanto produção. No caso de narradores ou locutores é mais uma opção de trabalho.


Mas, essa tecnologia ainda falha em abordar critérios que um locutor/ator entrega à produção: a emoção verdadeira e a interpretação que vem da alma. Essa interpretação que falamos em aulas de locução é fundamental para alcançar e envolver as pessoas.


Como estamos falando de tecnologia artificial, a entrega do que é prometido pelo software é bastante razoável e honesta. Não podemos esperar uma entonação de voz coerente com uma máquina sem alma, mas é um avanço e abre campos de trabalho para narradores. A conversão de texto em fala artificial tem várias vantagens quando comparada ao trabalho de um profissional.


Para os produtores de conteúdo, essa nova possibilidade abre espaço para a redução de mão de obra e consequente redução de cachês. O software de conversão de texto em fala reduz a necessidade de contratar pessoas muito qualificadas para fazer o trabalho. Assim, a mão-de-obra de produção ou de empresa pode se concentrar ou investir em outras partes do projeto. Daí a crescente aplicação do software.


O uso de software de conversão de texto em fala é mais econômico do que contratar um profissional de voz. Fato. A contratação de um profissional envolve custos associados à contratação, edição e, muitas vezes, regravação para obter uma narração perfeita. O uso de software elimina todos esses custos extras, mas é cobrado um alto preço por isso, já que não existe a "fala da alma".


Como já escrevi acima a narração de conversão de texto em fala ajuda o aprendizado para pessoas com dificuldades de leitura. Dessa forma, as pessoas têm uma voz consistente lendo o material, o que as ajuda a perceber e entender o que estão estudando, mas falta o tom e a emoção. Uma voz automatizada precisa de modulação, entonação, inflexão e nuances. Acho impossível que uma voz automatizada processe adequadamente as variadas pronúncias de palavras diferentes, como seres humanos. Consequentemente, isso pode inibir um grande grupo de pessoas de entender a voz automatizada. Pela natureza da edição, as palavras gravadas são frequentemente cortadas em suas entonações, o que dificulta a articulação e a compreensão.


No EAD, ensino a distância, a voz de um ser humano oferece às pessoas uma melhor experiência de aprendizado. Um locutor talentoso fornecerá uma apresentação cativante, soando como um professor apaixonado pela matéria. Soar natural é quase vital ao converter texto em fala. Isso é primordial em um ambiente de publicidade onde se não houver carisma não há venda. É provável que um apelo emocional, como um apelo à ação de compra ou algo parecido, caia no vazio se não for um ser humano de carne e osso que o expressa.


No mundo corporativo, a voz humana pode criar uma ponte, uma conexão sólida entre as pessoas, fortalecendo assim o vínculo entre a empresa e seus clientes, mas na mídia não vai funcionar.


Ensinamos, na Escola de Rádio, o uso da inflexão e do tom para obter ao máximo o impacto de venda de produto ou serviço. Da mesma forma, a contratação de um profissional para gravar os vídeos da sua marca - em vez de uma máquina - gera confiança, porque não apenas humaniza sua empresa, mas também a personifica.


Conclusão. Sou contra o uso desta ferramenta para as mídias tradicionais, pois não há alma. Sou a favor para o uso corporativo daquilo que é preciso informar para seus colaboradores. Qual o problema da voz artificial no ensino do uso de uma nova máquina, de um tutorial?


Futuro? Ninguém sabe ao certo, mas a decisão ficará por conta de nossos clientes. Sei que com essa tecnologia o locutor abre seu campo de trabalho.


Até agora sei que a emoção provocada quando ouvimos outro ser humano não é a mesma quando ouvimos uma réplica dele, uma máquina.

0 visualização
  • Grey Instagram Icon
  • Ícone cinza LinkedIn
  • Grey Facebook Icon
  • Grey Twitter Ícone
  • Grey YouTube Icon

@ruyjobim since 1964