Uma versão anterior do recém-lançado Grok-3, um modelo de linguagem de grande porte (LLM) de IA, superou sistemas rivais de IA do Google, OpenAI e DeepSeek em uma avaliação cega conduzida pela comunidade.

Em 18 de fevereiro, Elon Musk anunciou o lançamento do mais recente modelo de IA da xAI, Grok-3, durante uma transmissão ao vivo no X. Na discussão, a equipe da xAI revelou que havia lançado uma versão inicial do Grok-3 no LMarena sob o codinome “chocolate” para testes comunitários.

Fonte: LMArena

Apoio unânime às capacidades do Grok-3

O teste cego de LLM do Chatbot Arena permitiu que os usuários fizessem perguntas para dois chatbots de IA anônimos e os classificassem com base em suas respostas. Os testes já registraram coletivamente mais de um milhão de votos da comunidade.

De acordo com a comparação interna de modelos de IA da xAI, o Grok-3 obteve pelo menos 10 pontos a mais do que seus maiores concorrentes — ChatGPT o3mini, o1, Deepseek-R1 e Gemini-2 Flash Thinking — em matemática, ciência e programação.

Bot, Estados Unidos, Espaço, Elon Musk

Comparação entre Grok-3 e outros modelos de IA. Fonte: xAI

Grok-3 domina os chatbots de IA em todas as categorias

O LMArena também observou que o modelo inicial do Grok-3 atualmente ocupa o primeiro lugar em todas as categorias, incluindo desempenho geral com controle de estilo, prompts difíceis e prompts difíceis com controle de estilo, programação, matemática, escrita criativa, seguimento de instruções, consultas longas e interações de múltiplas etapas.

Desempenho do Grok-3 em todas as principais categorias. Fonte: LMArena

Musk e a equipe da xAI reiteraram a descoberta do LMArena de que o modelo inicial Grok-3 — codinome chocolate — atingiu um marco recorde de 1400 pontos. “E ainda está subindo. Então temos que continuar atualizando. Está em 1400 e subindo”, disse Musk.

Elon Musk prepara robôs Tesla alimentados pelo Grok para exploração espacial

Mais adiante no anúncio, Musk revelou planos para enviar um Tesla Bot, equipado com o modelo de inteligência artificial Grok da xAI, na próxima missão de Marte da SpaceX até o final de 2026.

Durante a discussão, ele revelou que a maioria dos projetos da SpaceX para exploração de Marte está programada para ocorrer por volta do quarto trimestre de 2026.

Ele explicou que a janela de trânsito entre a Terra e Marte ocorre a cada 26 meses, tornando novembro de 2026 a próxima oportunidade ideal para lançamentos de foguetes para o Planeta Vermelho.

Fonte: xAI

Musk também disse que pode enviar um Tesla Bot e Grok na missão para Marte:

“Se tudo correr bem, a SpaceX enviará foguetes Starship para Marte com robôs Optimus e Grok.”

Engenheiro do Grok-3 sai após ultimato

Em 12 de fevereiro, um engenheiro da xAI pediu demissão após uma publicação no X na qual classificou o Grok-3 abaixo do ChatGPT, compartilhando sua opinião pessoal antes do lançamento do modelo.

Fonte: Benjamin DeKraker

“Ou eu apagava a publicação citada abaixo ou seria demitido”, escreveu DeKraker, acrescentando:

“Após revisar tudo e pensar muito, decidi que não vou apagar a publicação — que claramente é apenas uma opinião pessoal inofensiva.”