A Mistral AI, uma startup de tecnologia sediada na França, lançou um novo modelo proprietário de linguagem grande (LLM) em um mercado de IA cada vez mais concorrido. A empresa aleg que o novo Mistral Large pode ameaçar seus concorrentes mais importantes.
Em uma postagem publicada em 26 de fevereiro, a empresa sediada em Paris declarou que o Mistral Large superou vários LLMs notáveis, exceto o GPT-4, em um teste de "compreensão de linguagem multitarefa" e teve um bom desempenho em vários testes de matemática e codificação.
No entanto, o desempenho do Mistral Large não foi comparado ao do Grok, da xAI, e do Gemini Ultra, do Google, que foram lançados em novembro passado e no início de fevereiro, respectivamente. O Cointelegraph entrou em contato com a Mistral AI para comentar o assunto
Guillaume Lample, fundador e cientista-chefe da empresa, afirma que o Mistral Large é "muito superior" aos modelos anteriores da Mistral AI. A Mistral AI também introduziu o "Le Chat" – uma interface de bate-papo com IA na parte superior de seus modelos – semelhante às versões 3.5 e 4 do ChatGPT.
Today, we are releasing Mistral Large, our latest model. Mistral Large is vastly superior to Mistral Medium, handles 32k tokens of context, and is natively fluent in English, French, Spanish, German, and Italian.
— Guillaume Lample (@GuillaumeLample) February 26, 2024
We have also updated Mistral Small on our API to a model that is… pic.twitter.com/MO4m6UIJUV
Hoje, estamos lançando o Mistral Large, nosso modelo [de IA] mais recente. O Mistral Large é muito superior ao Mistral Medium, lida com 32 mil tokens de contexto e é nativamente fluente em inglês, francês, espanhol, alemão e italiano.
Também atualizamos o Mistral Small em nossa API para um modelo que é...
— Guillaume Lample (@GuillaumeLample)
A empresa, que recebeu US$ 487 milhões de empresas como Nvidia, Salesforce e Andreessen Horowitz em uma rodada de financiamento concluída em dezembro, observou que o Mistral Large conhece mais de 20.000 palavras em inglês e também é fluente em francês, espanhol, alemão e italiano.

Embora o primeiro modelo da Mistral AI tenha sido lançado sob uma licença de código aberto, o Mistral Large é um modelo fechado e proprietário, semelhante aos LLMs mais recentes lançados pela OpenAI. Esta opção decepcionou alguns observadores do espaço.
Embora plataformas de classificação de chatbot de IA de terceiros, como a Chatbot Arena, não tenham avaliado o Mistral Large, seu modelo anterior, o Mistral Medium, está em sexto lugar em uma lista de mais de 60 LLMs.
As milhares de classificações em pares do Chatbot Arena são analisadas por meio de um modelo Bradley-Terry, que usa amostragem aleatória para produzir uma classificação "Elo", estimando qual modelo tem maior probabilidade de sucesso em uma competição direta contra outro modelo.
A Mistral também anunciou recentemente a celebração de uma parceria com a Microsoft, que tornará o Mistral Large acessível no Azure AI Studio e no Azure Machine Learning.
We're announcing a multi-year partnership with @MistralAI, as we build on our commitment to offer customers the best choice of open and foundation models on Azure. https://t.co/k1L7lfFeES
— Satya Nadella (@satyanadella) February 26, 2024
Estamos anunciando uma parceria plurianual com a @MistralAI, à medida que ampliamos nosso compromisso de oferecer aos clientes a melhor opção de modelos abertos e básicos no Azure.
— Satya Nadella (@satyanadella)
"A confiança da Microsoft em nosso modelo é mais um passo à frente em nossa jornada", disse a Mistral AI sobre a integração de seu LLM com foco comercial às plataformas da gigante de tecnologia.
O Mistral Large utilizará a "infraestrutura de supercomputação" do Azure para fins de treinamento e escalabilidade, enquanto as duas empresas também colaborarão em pesquisa e desenvolvimento de IA, de acordo com uma declaração de 26 de fevereiro de Eric Boyd, vice-presidente corporativo da Plataforma de IA Azure da Microsoft.
A Mistral Large custa US$ 8 por milhão de tokens de entrada e US$ 24 por milhão de tokens de saída, o que a torna apenas um pouco mais barata do que o GPT-4 Turbo, que custa US$ 10 e US$ 30, respectivamente.
A Mistral foi avaliada em quase US$ 2 bilhões em dezembro passado, de acordo com a Bloomberg.
LEIA MAIS