Uma versão anterior do recém-lançado Grok-3, um modelo de linguagem de grande porte (LLM) de IA, superou sistemas rivais de IA do Google, OpenAI e DeepSeek em uma avaliação cega conduzida pela comunidade.
Em 18 de fevereiro, Elon Musk anunciou o lançamento do mais recente modelo de IA da xAI, Grok-3, durante uma transmissão ao vivo no X. Na discussão, a equipe da xAI revelou que havia lançado uma versão inicial do Grok-3 no LMarena sob o codinome “chocolate” para testes comunitários.
Fonte: LMArena
Apoio unânime às capacidades do Grok-3
O teste cego de LLM do Chatbot Arena permitiu que os usuários fizessem perguntas para dois chatbots de IA anônimos e os classificassem com base em suas respostas. Os testes já registraram coletivamente mais de um milhão de votos da comunidade.
De acordo com a comparação interna de modelos de IA da xAI, o Grok-3 obteve pelo menos 10 pontos a mais do que seus maiores concorrentes — ChatGPT o3mini, o1, Deepseek-R1 e Gemini-2 Flash Thinking — em matemática, ciência e programação.
Comparação entre Grok-3 e outros modelos de IA. Fonte: xAI
Grok-3 domina os chatbots de IA em todas as categorias
O LMArena também observou que o modelo inicial do Grok-3 atualmente ocupa o primeiro lugar em todas as categorias, incluindo desempenho geral com controle de estilo, prompts difíceis e prompts difíceis com controle de estilo, programação, matemática, escrita criativa, seguimento de instruções, consultas longas e interações de múltiplas etapas.
Desempenho do Grok-3 em todas as principais categorias. Fonte: LMArena
Musk e a equipe da xAI reiteraram a descoberta do LMArena de que o modelo inicial Grok-3 — codinome chocolate — atingiu um marco recorde de 1400 pontos. “E ainda está subindo. Então temos que continuar atualizando. Está em 1400 e subindo”, disse Musk.
Elon Musk prepara robôs Tesla alimentados pelo Grok para exploração espacial
Mais adiante no anúncio, Musk revelou planos para enviar um Tesla Bot, equipado com o modelo de inteligência artificial Grok da xAI, na próxima missão de Marte da SpaceX até o final de 2026.
Durante a discussão, ele revelou que a maioria dos projetos da SpaceX para exploração de Marte está programada para ocorrer por volta do quarto trimestre de 2026.
Ele explicou que a janela de trânsito entre a Terra e Marte ocorre a cada 26 meses, tornando novembro de 2026 a próxima oportunidade ideal para lançamentos de foguetes para o Planeta Vermelho.
Fonte: xAI
Musk também disse que pode enviar um Tesla Bot e Grok na missão para Marte:
“Se tudo correr bem, a SpaceX enviará foguetes Starship para Marte com robôs Optimus e Grok.”
Engenheiro do Grok-3 sai após ultimato
Em 12 de fevereiro, um engenheiro da xAI pediu demissão após uma publicação no X na qual classificou o Grok-3 abaixo do ChatGPT, compartilhando sua opinião pessoal antes do lançamento do modelo.
Fonte: Benjamin DeKraker
“Ou eu apagava a publicação citada abaixo ou seria demitido”, escreveu DeKraker, acrescentando:
“Após revisar tudo e pensar muito, decidi que não vou apagar a publicação — que claramente é apenas uma opinião pessoal inofensiva.”