Formada por pesquisadores da Universidade Estadual de Campinas (Unicamp), a startup Maritaca AI foi criada com a ambição de posicionar o Brasil na vanguarda da inteligência artificial, mirando um espaço no mercado nacional equivalente ao que a OpenAI ocupa globalmente

A empresa fundada em 2022, um mês antes do lançamento público do ChatGPT, destaca-se pela iniciativa pioneira de desenvolver uma tecnologia capaz de lidar e interagir de forma avançada com o português, explorando demandas particulares de usuários e empresas brasileiras.

O primeiro passo da empresa para se tornar a "OpenAI brasileira" foi dado em dezembro do ano passado, com o lançamento público do MariTalk, um chatbot treinado e especializado em língua portuguesa. Intitulado Sabiá 2, o modelo de linguagem grande (LLM) da Maritaca AI foi desenvolvido com apoio do Google sob a forma de equipamentos e poder de processamento computacional, e fundamentou-se em uma curadoria de dados baseada em fontes e documentos em português.

Conforme demonstram dados da própria Maritaca AI, o Sabiá 2 supera modelos como o GPT 3.5 Turbo da OpenAI, o Gemini 1.0 Pro do Google, e o Mistral Large em 64 exames baseados na língua portuguesa. Entre eles, o Enem, o Enade, e os vestibulares da USP (Univesidade Federal de São Paulo) e da Unicamp. Segundo dados da própria Maritaca AI, conforme o gráfico abaixo, o Sabiá 2 só fica atrás do Chat GPT-4 Turbo e do Claude 3 Opus, da Anthropic, na relação de custo-benefício preço-performance.

Comparação da relação preço-performance do MariTalk com alguns dos principais chatbots de IA do mercado. Fonte: Maritaca AI

Atualmente, o MariTalk está disponível aos usuários finais gratuitamente em chat.maritaca.ai/. Os consumidores também podem optar por uma versão paga que pode ser hospedada localmente, garantindo maior segurança e a privacidade total dos dados processados pelo sistema.

"OpenAI brasileira"

Em entrevista ao portal SBT News, o líder da Maritaca AI, Rodrigo Nogueira, enfatizou a importância do desenvolvimento de tecnologias de inteligência artificial nacionais, que atendam às demandas tanto do setor público quanto do privado. Também não escondeu a ambição de que a startup seja reconhecida como a "OpenAI brasileira":

"Esse é o nosso desejo, desenvolver essa tecnologia em nível nacional. A razão para a gente ter essa “OpenAI brasileira” não é só porque a OpenAI está na moda, mas porque é algo verdadeiramente importante. Por exemplo, se você é um órgão do governo, como o Tribunal de Contas da União, você está ali tomando uma decisão se os pedidos de denúncia vão ser tratados ou não. Você não pode usar uma série de IAs lá fora para tomar essa decisão."

Assim como no caso da OpenAI e de outras empresas de IA estrangeiras, a Maritaca AI ambiciona criar um ecossistema capaz de abrigar outras startups e desenvolvedores para oferecer produtos e serviços que potencializem diferentes casos de uso para o MariTalk.

A infraestrutura e o poder computacional limitados representam os principais gargalos para a expansão e o desenvolvimento de modelos de IA no Brasil, segundo Nogueira. Ele afirmou que, sem o apoio do Google, "o desenvolvimento do MariTalk não teria sido viável." A coleta de dados em português também configura um grande desafio devido à ausência de uma regulamentação pertinente para o setor.

No momento, o PL 2.338/2023, que visa à regulamentação da inteligência artificial no Brasil, está sob análise de uma comissão interna do Senado instituída especialmente para tratar do assunto. Conforme noticiou o Cointelegraph Brasil, o autor do projeto e presidente do Senado, Rodrigo Pacheco (PSD-MG) estabeleceu o mês de abril como data limite para apreciação do PL em plenário.

Futuro da IA no Brasil

Além da atualização do Sábia 2 com dados recentes, os planos de expansão da Maritaca AI incluem o desenvolvimento de um modelo de geração de imagens, como o Midjourney, aplicações multimodais, que combinam recursos de imagem e texto, e a adaptação do Sabiá 2 para outras línguas. "Uma vez montada essa infraestrutura, você pode levá-la para outros domínios, em outras línguas, não fica tão difícil", explica Nogueira.

Projetando o desenvolvimento do setor de maneira mais ampla no Brasil, o líder da Maritaca AI vislumbra a criação de data centers para treinamento local de sistemas de IA em parceria com empresas que possam se beneficiar da nova tecnologia.

Testando o MariTalk

Para avaliar o desempenho do MariTalk, a equipe do Cointelegraph Brasil conduziu um teste comparativo entre o Sabiá 2 e o ChatGPT 3.5. O prompt escolhido fazia uma referência básica a investimentos em criptomoedas:

"Que dicas você daria para um investidor que quer começar a investir no mercado de criptomoedas?"

As respostas foram muito similares, com uma introdução que aponta os potenciais riscos e benefícios do investimento em criptomoedas, seguidos por uma lista de recomendações prudenciais, e uma conclusão sobre a volatilidade e o dinamismo do mercado.

Comparação das três primeiras respostas do Sabiá 2 (esquerda) e do Chat GPT 3.5 (direita).

Enquanto o ChatGPT 3.5 listou oito advertências para potenciais investidores, o Sabiá 2 apresentou dez recomendações. Notavelmente, as respostas do MariTalk se destacaram por sua clareza e objetividade.

As duas recomendações adicionais do chatbot brasileiro também mostraram-se pertinentes, A primeira sugeria que os investidores pesquisassem os projetos nos quais tivessem a intenção de investir antes de realizar eventuais aportes, enquanto a segunda os orientava a realizar pequenos investimentos a título de experimentação antes de arriscar quantias significativas de seus patrimônios pessoais em criptomoedas.

Recursos de IA vem sendo adotados em larga escala pelo poder público no Brasil. Conforme noticiou o Cointelegraph Brasil recentemente, o governo brasileiro adotou a tecnologia em um sistema de fiscalização de beneficiários do Bolsa Família.