O laboratório de pesquisa de IA do Google, DeepMind, afirmou que seu novo modelo de inteligência artificial, Gemini 2.0, será a base para a construção de agentes de IA mais avançados.

Um agente de IA alimentado pelo Gemini 2.0, lançado em 11 de dezembro, pode entender instruções complexas, planejar, raciocinar, realizar ações em sites e até mesmo ajudar com estratégias de videogames, disseram o CEO do Google DeepMind, Demis Hassabis, e o diretor de tecnologia, Koray Kavukcuoglu, em um post no blog de 11 de dezembro.

“A aplicação prática de agentes de IA é uma área de pesquisa cheia de possibilidades empolgantes,” afirmaram Hassabis e Kavukcuoglu.

“Estamos explorando essa nova fronteira com uma série de protótipos que podem ajudar as pessoas a realizar tarefas e concluir atividades.”

De acordo com Hassabis e Kavukcuoglu, há vários projetos experimentais de assistente de IA alimentados pelo Gemini com diferentes funções.

Um deles, conhecido como Deep Research, ajuda os usuários a explorar tópicos complexos criando planos de pesquisa em várias etapas, pesquisando na web e gerando relatórios detalhados sobre suas descobertas.

O Projeto Astra, um assistente universal de IA, é voltado para tarefas cotidianas, como fornecer recomendações e conselhos baseados em comandos fornecidos pelo usuário, como lavar roupas ou informações sobre um ponto turístico.

O Projeto Mariner se concentra em criar um agente de IA que pode assumir o controle do navegador Chrome, mover o cursor, clicar em botões, preencher formulários e navegar em sites.

De acordo com Hassabis e Kavukcuoglu, esses projetos “ainda estão nas primeiras fases de desenvolvimento,” mas esperam torná-los “amplamente disponíveis em produtos no futuro” após mais testes e desenvolvimentos.

“Ainda é cedo, mas o Projeto Mariner mostra que está se tornando tecnicamente possível navegar dentro de um navegador, embora não seja sempre preciso e seja lento para concluir tarefas hoje, algo que melhorará rapidamente ao longo do tempo.”

Enquanto isso, o Projeto Jules está sendo desenvolvido como um assistente para desenvolvedores que pode se integrar diretamente a um fluxo de trabalho no GitHub e ajudar com tarefas como codificação e planejamento.

Hassabis e Kavukcuoglu também afirmaram que desenvolveram agentes usando o Gemini 2.0 para videogames que podem oferecer sugestões em tempo real aos jogadores sobre o que fazer em seguida e buscar um “vasto conhecimento sobre jogos” online.

“Estamos colaborando com grandes desenvolvedores de jogos como a Supercell para explorar como esses agentes funcionam, testando sua capacidade de interpretar regras e desafios em uma ampla gama de jogos, de títulos de estratégia a simuladores de fazenda,” disseram.

Em novembro, Marc Benioff, CEO da empresa americana de software de computação em nuvem Salesforce, afirmou que o futuro da IA reside em agentes autônomos em vez de grandes modelos de linguagem (LLMs).

“Na verdade, acho que estamos atingindo os limites superiores dos LLMs agora,” afirmou ele no podcast Future of Everything do The Wall Street Journal em 23 de novembro.

A Nvidia também está se posicionando à frente dessa tendência.

“Estamos vendo o número de empresas nativas de IA continuar crescendo. E, claro, estamos começando a ver a adoção corporativa da IA agentic realmente se tornar o mais novo fenômeno,” afirmou o CEO da Nvidia, Jensen Huang, em uma teleconferência sobre os resultados do terceiro trimestre em novembro.

Além disso, Hassabis e Kavukcuoglu disseram que a equipe está “experimentando com agentes que podem ajudar no mundo físico” por meio da robótica.

Os agentes de IA do Google estão sendo liberados apenas para testadores e desenvolvedores neste estágio.