Após vários atrasos supostamente relacionados à segurança e ajustes, o tão esperado "Advanced Voice Mode" (AVM) do ChatGPT da OpenAI está agora disponível em versão alfa para usuários selecionados.
O recurso AVM foi anunciado e demonstrado em maio. Ele permite que os usuários tenham uma conversa em tempo real com o modelo de inteligência artificial ChatGPT por meio de um módulo de sintetização de texto para fala.
Lembra do Duplex?
Aqueles familiarizados com o conceito podem lembrar do anúncio do Google em 2018 de que seu serviço de IA "Duplex" estaria disponível "em breve". No evento de desenvolvedores IO, a empresa mostrou um sistema de IA capaz de ligar para empresas em seu nome para agendar compromissos em tempo real com humanos.
A grande ideia, de acordo com o Google, era que a IA seria robusta o suficiente para lidar com conversas casuais e confirmar as informações corretas.
O projeto Duplex acabou sendo encerrado, mas seu legado aparentemente vive no ChatGPT da OpenAI.
Modo de voz Avançado
O AVM apresenta comunicação em tempo real que tenta imitar discussões humanas. O ChatGPT responde às perguntas dos usuários com uma voz semelhante à humana, que tem uma cadência natural. Os usuários podem interromper o chatbot no meio de uma frase e, com base na demonstração, ele pode acompanhar o que foi dito.
A empresa está lançando o recurso em versão alfa limitada para continuar avaliando suas capacidades e implicações de segurança. Embora as demonstrações de maio tenham sido impressionantes, houve alguns momentos problemáticos e não é difícil imaginar cenários em que a tecnologia poderia ser mal utilizada.

Segundo a OpenAI, a segurança tem sido a principal preocupação da empresa. Em uma postagem no X anunciando o lançamento do recurso, a empresa escreveu:
"Testamos as capacidades de voz do GPT-4o com mais de 100 testadores externos em 45 idiomas. Para proteger a privacidade das pessoas, treinamos o modelo para falar apenas nas quatro vozes predefinidas e construímos sistemas para bloquear saídas que diferem dessas vozes. Também implementamos medidas de proteção para bloquear solicitações de conteúdo violento ou protegido por direitos autorais."
O lançamento temporizado do AVM já começou, de acordo com a OpenAI, e continuará com mais usuários sendo adicionados "de forma contínua". A empresa espera que o recurso esteja disponível para todos os assinantes Plus no outono.