A OpenAI lançou um novo agente para seu principal produto de inteligência artificial, o ChatGPT, chamado “deep research”, que pode vasculhar a internet em busca de informações para criar um relatório “no nível de um analista de pesquisa”.
A OpenAI afirmou em um post de blog em 2 de fevereiro que o deep research foi “construído para pessoas que realizam trabalhos intensivos de conhecimento em áreas como finanças, ciência, política e engenharia e que precisam de pesquisas minuciosas, precisas e confiáveis.”
A empresa acrescentou que também é útil para pesquisas antes da compra de itens de alto valor, como carros ou eletrodomésticos, e que os resultados — que podem levar de 5 a 30 minutos — são “totalmente documentados, com citações claras e um resumo de seu raciocínio.”
Um exemplo do modo “deep research” do ChatGPT mostrando seu progresso e citações. Fonte: OpenAI
O mais recente agente segue o lançamento do Operator pela OpenAI em 23 de janeiro, um agente do ChatGPT que pode usar a internet para concluir tarefas como fazer compras e reservar passeios turísticos.
Isso também ocorre cerca de uma semana depois que o espaço de IA e as ações de tecnologia dos EUA foram abaladas por um novo modelo de IA da DeepSeek, da China, que supostamente teve desempenho tão bom quanto o ChatGPT, mas foi desenvolvido por uma fração do custo.
A Microsoft e a OpenAI estão investigando se dados da API do ChatGPT foram obtidos de maneira indevida por um grupo ligado ao DeepSeek.
A OpenAI afirmou que seu agente deep research obteve um novo recorde na avaliação de IA chamada Humanity’s Last Exam, que contém 3.000 perguntas de nível especialista em mais de 100 tópicos, alcançando uma precisão de 26,6% em comparação com 9,4% do DeepSeek-R-1 e 3,3% do próprio modelo GPT-4o.
O agente é alimentado pelo modelo OpenAI o3, mas “otimizado para navegação na web e análise de dados.” O OpenAI o3 é o mais recente “modelo de raciocínio” da empresa, que tenta essencialmente verificar a si mesmo para evitar erros factuais ou geração de informações falsas.
A OpenAI alertou que o deep research “às vezes pode alucinar fatos em respostas ou fazer inferências incorretas” e pode “ter dificuldades em distinguir informações autoritativas de rumores.”
No mês passado, o Google anunciou que lançaria um recurso semelhante, também chamado “Deep Research”, para seu modelo de IA Gemini no início de 2025, enquanto a OpenAI afirmou que seu agente agora está disponível em seu plano Pro de US$ 200 por mês, limitado a 100 consultas mensais.