Dois pesquisadores da Universidade de Tsukuba, no Japão, criaram recentemente um sistema de gerenciamento de portfólios de criptomoedas baseado em inteligência artificial que utiliza dados on-chain que seria o primeiro do gênero, de acordo com a dupla. 

Chamado de CryptoRLPM, abreviação de "Cryptocurrency reinforcement learning portfolio manager" (Gerente de portfólio de aprendizagem por reforço de criptomoedas, em tradução livre), o sistema de inteligência artificial (IA) utiliza uma técnica de treinamento chamada "aprendizagem por reforço" para implementar dados on-chain em seu modelo.

A aprendizado por reforço (RL) é um paradigma de otimização em que um sistema de IA interage com seu ambiente – nesse caso, um portfólio de criptomoedas – e atualiza seu treinamento com base em sinais de recompensa.

O CryptoRLPM aplica o feedback da RL em toda a sua arquitetura. O sistema está estruturado em cinco unidades principais que trabalham juntas para processar informações e gerenciar portfólios estruturados.

Esses módulos incluem uma unidade de alimentação de dados, uma unidade de refinamento de dados, uma unidade de agente de portfólio, uma unidade de negociação ao vivo e uma unidade de atualização de agente.

Captura de tela da pesquisa pré-impressa. Fonte: Huang, Tanaka, "A Scalable Reinforcement Learning-based System Using On-Chain Data for Cryptocurrency Portfolio Management" (Um sistema escalável baseado em aprendizado por reforço usando dados on-chain para gerenciamento de portfólios de criptomoedas)

Depois de desenvolvido, os cientistas testaram o CryptoRLPM atribuindo-lhe três portfólios. A primeira continha apenas Bitcoin (BTC) e Storj (STORJ), a segunda mantinha BTC e STORJ e acrescentava Bluzelle (BLZ), e a terceira mantinha as três juntamente com Chainlink (LINK).

Os experimentos foram realizados em um período que foi de outubro de 2020 a setembro de 2022, com três fases distintas (treinamento, validação e teste).

Os pesquisadores mediram o sucesso do CryptoRLPM em relação a uma avaliação de linha de base do desempenho padrão do mercado por meio de três métricas: taxa de retorno acumulada (AAR), taxa de retorno diária (DRR) e índice Sortino (SR).

AAR e DRR são medidas rápidas de quanto um ativo perdeu ou ganhou em um determinado período de tempo, e o SR mede o retorno ajustado ao risco de um ativo.

Captura de tela da pesquisa pré-impressa. Fonte: Huang, Tanaka, "A Scalable Reinforcement Learning-based System Using On-Chain Data for Cryptocurrency Portfolio Management" (Um sistema escalável baseado em aprendizado por reforço usando dados on-chain para gerenciamento de portfólios de criptomoedas)

De acordo com o artigo pré-impresso, o CryptoRLPM obtém melhorias significativas em relação ao desempenho da linha de base do Bitcoin:

"Especificamente, o CryptoRLPM mostra pelo menos um incremento de 83,14% na ARR, pelo menos uma melhoria de 0,5603% na DRR e pelo menos uma melhoria de 2,1767 na SR, em comparação com a linha de base do Bitcoin."

LEIA MAIS