A indústria da inteligência artificial generativa (IA) continua a se aquecer, já que a OpenAI apresentou o GPT-4V, um modelo com capacidade de visão, e modos de conversação multimodais para seu sistema ChatGPT.
Com as novas atualizações, anunciadas em 25 de setembro, os usuários do ChatGPT poderão se envolver em conversas com o chatbot. Os modelos que alimentam o ChatGPT, GPT-3.5 e GPT-4, agora conseguem compreender consultas faladas em linguagem simples e responder com uma das cinco vozes diferentes.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
Segundo um post no blog da OpenAI, essa nova interface multimodal permitirá que os usuários possam interagir com o ChatGPT de maneiras inovadoras:
"Tire uma foto de um ponto turístico enquanto viaja e tenha uma conversa ao vivo sobre o que há de interessante nele. Quando estiver em casa, tire fotos da sua geladeira e despensa para descobrir o que fazer para o jantar (e faça perguntas adicionais para obter uma receita passo a passo). Depois do jantar, ajude seu filho com um problema de matemática tirando uma foto, circulando o conjunto de problemas e obtendo dicas para ambos."
A versão atualizada do ChatGPT será lançada para os usuários Plus e Enterprise em plataformas móveis nas próximas duas semanas, com acesso subsequente para desenvolvedores e outros usuários "em breve".
A atualização multimodal do ChatGPT chega logo após o lançamento do DALL-E 3, o sistema de geração de imagens mais avançado da OpenAI.
Segundo a OpenAI, o DALL-E 3 também integra processamento de linguagem natural. Isso permite que os usuários conversem com o modelo para refinar resultados e integrem o ChatGPT para obter ajuda na criação de prompts de imagem.
Ainda sobre IA, a concorrente da OpenAI, Anthropic, anunciou uma parceria com a Amazon em 25 de setembro. Conforme relatado pela Cointelegraph, a Amazon investirá até $4 bilhões para incluir serviços em nuvem e acesso a hardware. Em troca, a Anthropic afirmou que fornecerá suporte aprimorado para o modelo fundamental de IA da Amazon, chamado Bedrock, juntamente com "personalização segura de modelos e ajustes finos para empresas".