A IBM lançou recentemente um novo “Lightweight Engine” para seu serviço WatsonX.ai. Embora seja voltado principalmente para “empresas”, ele pode servir como uma rampa de acesso para garantir a implantação interna de IA generativa para empresas menores que buscam escalar ou empresas de médio porte em setores emergentes, como fintech.

O mercado de IA generativa é, indiscutivelmente, o principal catalisador por trás do crescimento da receita do setor de tecnologia no primeiro semestre de 2024. Apenas dez anos antes, poucos poderiam ter previsto o tamanho e o escopo de um setor amplamente impulsionado pela popularidade explosiva de grandes modelos de linguagem, como o ChatGPT da OpenAI e o Claude da Anthropic.

IA generativa em serviços financeiros

Antes do lançamento do ChatGPT, especialistas nas comunidades de IA e finanças notaram que grandes modelos de linguagem, como o GPT-3, simplesmente não eram confiáveis ​​ou precisos o suficiente para uso no mundo das finanças ou em qualquer outro lugar onde não houvesse margem para erro.

Apesar dos avanços no campo desde o ChatGPT 2023, o mesmo ditado continua verdadeiro: modelos de IA treinados para uso geral, em dados públicos, são tão imprevisíveis quanto as informações nas quais são treinados. Para que um modelo de IA generativo seja mais do que apenas um chatbot que pode executar algumas funções de codificação, os modelos precisam ser especializados.

O JP Morgan Chase, por exemplo, comprou recentemente acesso empresarial ao ChatGPT da OpenAI para toda a sua força de trabalho de 60.000 funcionários, o que inclui ajuste fino em dados internos e guardrails personalizados. Está claro que até mesmo o setor de serviços financeiros está pulando a bordo do trem da IA ​​generativa.

Além dos chatbots

Embora muitos serviços populares de IA voltados ao público, como o ChatGPT, ofereçam opções de nível empresarial, eles tendem a ser totalmente baseados em nuvem. Em setores onde deveres regulatórios e fiduciários exigem que certos tipos de dados sejam isolados da possibilidade de manipulação externa, como os setores de fintech e serviços financeiros, as soluções de IA baseadas em nuvem podem não atender aos requisitos de segurança.

O WatsonX.ai da IBM funciona com soluções baseadas em nuvem e locais e, com a adição do Lightweight Engine, os modelos podem ser executados e implantados no local com uma pegada reduzida.

O Cointelegraph perguntou à IBM sobre as aplicações do serviço e Savio Rodrigues, vice-presidente de Engenharia de Ecossistemas e Advocacia de Desenvolvedores da empresa, nos disse:

"À medida que as empresas adicionam on-premises, elas querem a plataforma mais leve para a empresa implementar e executar seus casos de uso de IA generativa, para que não desperdicem CPUs ou GPUs. É aqui que entra o mecanismo leve watsonx.ai, permitindo que ISVs e desenvolvedores dimensionem soluções GenAI empresariais enquanto otimizam custos."

Em fintech e outros setores emergentes — como mineração, blockchain e empréstimos com criptomoedas — onde soluções de IA externas podem não atender a todas as necessidades de segurança de uma empresa, a flexibilidade de uma solução baseada em nuvem e com capacidade local pode significar a diferença entre desenvolver e implantar modelos internamente ou assinar a solução de outra empresa.

No entanto, há uma série de serviços concorrentes com empresas que vão desde Microsoft, Google e Amazon, até startups focadas em desenvolver soluções de IA personalizadas que fornecem serviços semelhantes.

Embora uma comparação direta de serviços esteja além do escopo deste artigo, o Lightweight Engine da IBM parece fazer jus ao seu nome. Sua pegada reduzida e eficiência aumentada vêm ao preço de perder alguns recursos que só estariam disponíveis na versão de peso total.