OpenAI finalmente lança o 'Modo de Voz Avançado' para usuários selecionados do ChatGPT

01 de ago. de 2024

As primeiras prévias da tecnologia foram notáveis, mas os temores permanecem sobre seu potencial uso indevido.

OpenAI finalmente lança o 'Modo de Voz Avançado' para usuários selecionados do ChatGPT — Notícias

Após vários atrasos supostamente relacionados à segurança e ajustes, o tão esperado "Advanced Voice Mode" (AVM) do ChatGPT da OpenAI está agora disponível em versão alfa para usuários selecionados.

O recurso AVM foi anunciado e demonstrado em maio. Ele permite que os usuários tenham uma conversa em tempo real com o modelo de inteligência artificial ChatGPT por meio de um módulo de sintetização de texto para fala.

Lembra do Duplex?

Aqueles familiarizados com o conceito podem lembrar do anúncio do Google em 2018 de que seu serviço de IA "Duplex" estaria disponível "em breve". No evento de desenvolvedores IO, a empresa mostrou um sistema de IA capaz de ligar para empresas em seu nome para agendar compromissos em tempo real com humanos.

A grande ideia, de acordo com o Google, era que a IA seria robusta o suficiente para lidar com conversas casuais e confirmar as informações corretas.

O projeto Duplex acabou sendo encerrado, mas seu legado aparentemente vive no ChatGPT da OpenAI.

Modo de voz Avançado

O AVM apresenta comunicação em tempo real que tenta imitar discussões humanas. O ChatGPT responde às perguntas dos usuários com uma voz semelhante à humana, que tem uma cadência natural. Os usuários podem interromper o chatbot no meio de uma frase e, com base na demonstração, ele pode acompanhar o que foi dito.

A empresa está lançando o recurso em versão alfa limitada para continuar avaliando suas capacidades e implicações de segurança. Embora as demonstrações de maio tenham sido impressionantes, houve alguns momentos problemáticos e não é difícil imaginar cenários em que a tecnologia poderia ser mal utilizada.

Segundo a OpenAI, a segurança tem sido a principal preocupação da empresa. Em uma postagem no X anunciando o lançamento do recurso, a empresa escreveu:

"Testamos as capacidades de voz do GPT-4o com mais de 100 testadores externos em 45 idiomas. Para proteger a privacidade das pessoas, treinamos o modelo para falar apenas nas quatro vozes predefinidas e construímos sistemas para bloquear saídas que diferem dessas vozes. Também implementamos medidas de proteção para bloquear solicitações de conteúdo violento ou protegido por direitos autorais."

O lançamento temporizado do AVM já começou, de acordo com a OpenAI, e continuará com mais usuários sendo adicionados "de forma contínua". A empresa espera que o recurso esteja disponível para todos os assinantes Plus no outono.

A Cointelegraph está comprometida com um jornalismo independente e transparente. Este artigo de notícias é produzido de acordo com a Política Editorial da Cointelegraph e tem como objetivo fornecer informações precisas e oportunas. Os leitores são incentivados a verificar as informações de forma independente. Leia a nossa Política Editorial https://br.cointelegraph.com/editorial-policy