A OpenAI está prestes a lançar uma versão “aberta” de seu modelo de linguagem ainda este ano, permitindo que desenvolvedores executem o modelo em seus próprios hardwares.
Em uma atualização publicada no X em 31 de março, o CEO da OpenAI, Sam Altman, disse que a empresa de inteligência artificial lançará nos próximos meses um novo “modelo de linguagem com pesos abertos e capacidade de raciocínio”, mas que primeiro gostaria de receber feedback sobre “como torná-lo o mais útil possível.”
“Estamos pensando nisso há muito tempo, mas outras prioridades vieram primeiro. Agora parece importante fazer isso”, disse ele, acrescentando que esse será o primeiro modelo com pesos abertos desde o GPT-2 em 2019.
Ele acrescentou: “Ainda temos algumas decisões a tomar, então estamos organizando eventos para desenvolvedores a fim de coletar feedback e depois testar protótipos iniciais.”
Fonte: Sam Altman
Um modelo de linguagem com pesos abertos é disponibilizado publicamente para qualquer pessoa utilizar, baixar, modificar ou implantar para seus próprios fins. Ele não é tão aberto quanto um modelo de código aberto, mas representa uma mudança em relação ao GPT-3 e ao GPT-4, que foram totalmente fechados.
Altman disse que os eventos para desenvolvedores do GPT-2 começarão em San Francisco, Califórnia — onde fica a sede da OpenAI — nas próximas semanas, seguidos por sessões na Europa e na região da Ásia-Pacífico.
Fonte: Steven Heidel
“Estamos empolgados para ver o que os desenvolvedores vão construir e como grandes empresas e governos utilizarão o modelo em situações onde preferem executá-lo localmente”, disse Altman.
“Faremos um esforço extra, já que sabemos que este modelo será modificado após o lançamento.”
Primeiro modelo “aberto” da OpenAI desde o GPT-2, em 2019
O modelo de linguagem GPT-2 da OpenAI com pesos abertos foi lançado parcialmente em fevereiro de 2019, com a liberação total ocorrendo em novembro do mesmo ano.
Altman também afirmou em 12 de fevereiro que sua empresa pretende lançar o GPT-4.5 e o GPT-5 nas próximas semanas ou meses.
A corrida armamentista da IA vem se intensificando com o lançamento do rival DeepSeek, que funciona de maneira semelhante ao ChatGPT, mas foi supostamente desenvolvido com uma fração do custo e do tempo.
O Alibaba Group lançou em 26 de março seu novo modelo de IA de código aberto para agentes de IA de baixo custo, enquanto o Google introduziu o Gemini 2.5, seu mais recente modelo experimental de inteligência artificial, em 25 de março.
Enquanto isso, o CEO da Meta, Mark Zuckerberg, afirmou em uma publicação no Threads em 19 de março que a família de modelos de IA da empresa, Llama, lançada em fevereiro de 2023, alcançou 1 bilhão de downloads.