Código da vida: Blockchain e o futuro da genômica

Em uma época de debates altamente disputados em torno da propriedade de dados, privacidade e monetização, um dado em particular poderia ser considerado o mais pessoal de todos: o genoma humano.

Apesar de sermos 99,9% idênticos em nossa composição genética em toda a espécie, os 0,1% restantes contêm variações únicas no código que influenciam nossa predisposição para certas doenças e até mesmo nossos vieses temperamentais - um modelo de como somos suscetíveis a tudo, desde o coração doença e Alzheimer à inveja, imprudência e ansiedade.

2018 ofereceu amplos exemplos de como os agentes mal-intencionados podem causar estragos com o uso nefasto de dados relativamente triviais. Para os interessados em proteger essa forma mais crítica de identidade, o blockchain despertou considerável interesse como uma poderosa alternativa às arquiteturas fechadas e explorações proprietárias do mercado de dados genômicos existentes - prometendo, em seu lugar, um protocolo seguro e aberto para o código da vida.

Correntes criptografadas

O sequenciamento do genoma humano até o nível molecular das quatro "letras" que se ligam às hélices de fita dupla de nosso DNA foi concluído em 2003. O projeto custou US $ 3,7 bilhões e 13 anos de poder computacional. Hoje, custa US $ 1.000 por genoma único e leva uma questão de dias. Estima-se que em breve custará apenas US $ 100.

DNA SEQUENCING COST PER GENOME

À medida que o desenvolvimento de medicamentos baseados em dados genômicos e as terapias-alvo evoluírem, espera-se que o interesse das empresas farmacêuticas e de biotecnologia catapulte o mercado de dados genômicos nos próximos anos, com previsão de atingir US $ 27,6 bilhões até 2025.

Se o conjunto de dados de seus gostos no Facebook e estupefação de feeds de notícias já tiver sido reconhecido como um recurso importante e monetizável, o valor bloqueado em seu código genético está aumentando exponencialmente à medida que a revolução na medicina de precisão e na edição de genes ganha ritmo.

No ano passado, foram concedidas aprovações sem precedentes para novas terapias gênicas nos EUA. Um deles edita células do sistema imunológico de um paciente para curar o linfoma não-Hodgkin; outro trata uma doença retiniana hereditária rara que pode levar à cegueira.

No entanto, aqui está o problema.

O potencial incomparável da Genomics para desencadear uma mudança de paradigma na medicina moderna depende de alavancar vastos conjuntos de dados para estabelecer correlações entre variantes genéticas e características.

Gerar a explosão de grandes dados genômicos que ainda são necessários para decodificar os 4 bits do organismo vivo enfrenta obstáculos que não são apenas científicos, mas éticos, sociais e tecnológicos.

Para muitos na fronteira dessa fronteira, é exatamente onde entra o lendário livro branco de 2008 de Nakamoto - e a tecnologia que viria a ser conhecida como blockchain -.

A Cointelegraph falou com três figuras do espaço de genômica blockchain para descobrir o porquê.

Quem é o dono do seu genoma? Ressuscitando o mamute lanoso... e o blockchain

Para o professor George Church, o mundialmente famoso geneticista em Harvard, as fronteiras entre as tecnologias dentro e fora do laboratório são porosas. Tendo sido pioneiro no sequenciamento direto do genoma em 1984, um breve resumo de suas recentes ambições incluem tentativas de ressucitar o há muito extindo mamute, criar vi células a prova de vírus e até reverter o envelhecimento.

Ele agora colocou outra tecnologia de ponta no centro da revolução da genômica: blockchain.

No ano passado, a Igreja - ao lado dos colegas de Harvard, Dennis Grishin e Kamal Obbad - cofundaram a startup de blockchain, a Nebula Genomics. A Igreja vinha tentando há anos acelerar e impulsionar a geração de dados genômicos em escala. Ele havia apelado a voluntários para contribuir com seu Personal Genome Project (PGP) sem fins lucrativos - uma "Wikipedia" de dados genômicos humanos de acesso aberto que agregou cerca de 10 mil amostras até o momento.

O PGP se baseou em pessoas que perderam tanto a privacidade quanto a propriedade em busca do avanço da ciência. Como Church disse em uma entrevista recente, a maioria era "particularmente altruísta", ou pessoas preocupadas em acelerar a pesquisa de uma doença em particular por causa de experiências familiares.

Em outros casos, como o especialista em cibersegurança DNABits, Dror Sam Brama, disse ao Cointelegraph, são os próprios pacientes que geram os dados e estão “doentes o suficiente para jogar fora qualquer propriedade e preocupação com a privacidade”:

“Os muito doentes chegam ao sistema de saúde e dizem: 'Nós lhe daremos o que você quiser, aceite, assinamos qualquer documento, consentimento. Apenas nos cure, encontre uma cura.”

O desafio é conseguir todo mundo. Embora ninguém saiba exatamente quantas pessoas tiveram seus genomas seqüenciados até o momento, algumas estimativas sugerem que seja em torno de um milhão.

Startups como Nebula e DNABits propõem que um ecossistema tokenizado e habilitado para blockchain pode ser o ponto de inflexão tecnológico para a integração das massas.

Ao permitir que as pessoas monetizem seus genomas e vendam o acesso diretamente aos compradores de dados, a Nebula acredita que sua plataforma poderia ajudar a reduzir os custos de sequenciamento “a zero ou até mesmo oferecer [pessoas] um lucro líquido”.

Embora a Nebula não subsidie o sequenciamento completo do genoma diretamente, um modelo blockchain permitiria que compradores interessados - digamos, duas empresas farmacêuticas - acionassem o dinheiro da seqüência de alguém em troca do acesso a seus dados.

A tokenização abre a flexibilidade e o consentimento granular para ativar diferentes cenários. Como Brama sugeriu, um proprietário de dados poderia ter direito a ações em qualquer droga que pudesse ser desenvolvida com base na pesquisa que eles permitiram ou foram reembolsados por sua prescrição médica em tokens de criptografia. Os contratos seriam publicados e hash, e referência ao consentimento do indivíduo registrado no blockchain.

Distopias genômicas

Conduzir e acelerar a geração de dados é apenas uma parte da equação.

A Nebula publicou uma pesquisa que descobriu que, em vez de simplesmente acessibilidade, a privacidade e as preocupações éticas eclipsavam todos os outros fatores quando as pessoas eram perguntadas se considerariam ou não ter seu genoma sequenciado. Em outro estudo de 13.000 pessoas, 86% disseram estar preocupadas com o uso indevido de seus dados genéticos: mais da metade ecoou temores sobre privacidade.

NEBULA'S SURVEY ON GENOME SEQUENCING

Essas preocupações não estão simplesmente fundadas na ficção científica distópica dos anos 90 de Hollywood - pense no  imaginário biopunk de Gattaca de uma sociedade futura sob a pressão de uma febre neo-eugenista.

Como Ofer Lidsky - cofundador, CEO e CTO da startup DNAtix de genômica de blockchain - diz:

“Uma vez que seu DNA tenha sido comprometido, você não poderá mudá-lo. Não é como um cartão de crédito que você pode cancelar e receber um novo. Seu código genético está com você por toda a sua vida [...] Uma vez que tenha sido comprometido, não há caminho de volta."

Os dados são cada vez mais interceptados, comercializados e até mesmo armados. Sequenciamento - muito menos compartilhamento - seu genoma talvez seja um passo além do que muitos estão dispostos a aceitar, dada sua singularidade, irrevogabilidade e longevidade.

O brama da DNABits deu sua segurança cibernética, dizendo que:

“As conseqüências são muito difíceis de imaginar, mas em um mundo em que as pessoas estão construindo portadores como vírus que se espalharão pelas células do corpo e as editarão - é assustador, mas na verdade, todos os blocos de construção já estão lá: sequenciamento do genoma, violações de dados, edição genética. As pessoas agora estão trabalhando para corrigir as principais condições de saúde usando edição genética in vivo. Mas devemos supor que todas as ferramentas acabarão por cair nas mãos erradas”.

Ele acrescentou: "Não estamos falando em tirar vantagem de alguém apenas por uma noite com GHB ou alguma outra droga" - isso afetaria o resto da vida de um indivíduo.

Em abril, logo após o escândalo da Cambridge Analytica, noticiou-se a notícia de que detetives da polícia haviam minerado fragmentos uma base de dados genealógicos de DNA de indivíduos que esperavam ajudar a resolver um caso de assassinato que esfriara há mais de trinta anos.

A polícia não enfrentou resistência em acessar um estoque centralizado de material genético que havia sido carregado por um público inconsciente. E enquanto muitos saudaram a prisão do Assassino do Estado Dourado através de um emaranhado de DNA, outros expressaram desconforto considerável.

Essa obscuridade do acesso tem implicações além da perícia. Embora a distopia de Brama possa estar um pouco distante, hoje existem preocupações sobre a discriminação genética por parte de empregadores e empresas de seguros - o último dos quais atualmente é apenas legalmente proscrito de maneira parcial. Grishin ecoou isso, observando que nos EUA, "você pode ter seu seguro de vida negado por causa de seu DNA".

Em maio deste ano, a Comissão Federal de Comércio dos EUA abriu uma investigação sobre as empresas populares de testes genéticos de consumo - incluindo 23andMe e Ancestry.com - sobre suas políticas de tratamento de informações pessoais e genéticas e como elas compartilham esses dados com terceiros.

O 23andMe e o Ancestry.com representam um fenômeno recente dos chamados testes genéticos direto ao consumidor, cuja popularidade é estimada em mais que o dobro no ano passado.

Essas empresas usam uma técnica mais restrita chamada genotipagem, que identifica 600.000 posições espaçadas em intervalos regulares em todas as 6,4 bilhões de letras de um genoma inteiro. Embora limitado, ainda revela informações genéticas inerentemente pessoais.

O altamente popular kit de genotipagem caseiro 23andMe - embalado como "Welcome to You" - promete contar às pessoas tudo, desde a maquiagem ancestral até a probabilidade de passarem as noites nas agitadas garras da insônia. O kit vem com um preço tão baixo quanto $ 99.

Em julho, a sexta maior empresa farmacêutica do mundo, a GlaxoSmithKline (GSK), investiu US $ 300 milhões em um contrato de quatro anos para obter acesso ao banco de dados da 23andMe, e estima-se que a firma de testes tenha ganho US $ 130 milhões vendendo acesso a cerca de um milhão de pessoas. genótipos, trabalhando a um preço médio de cerca de US $ 130. Em comparação, o Facebook supostamente gera cerca de US $ 82 em receita bruta a partir dos dados de um único usuário ativo.

Sistemas blockchain à prova de batalhas e anônimos para a revolução da genômica

Nesse cenário de dados genômicos cada vez mais opaco, as empresas privadas monetizam os dados genotípicos gerados por seus consumidores, e os dados de sequência são fragmentados em silos proprietários e centralizados - seja nos sistemas legados de instituições de pesquisa e de saúde ou nos sistemas privados de propriedade empresas de biotecnologia.

Trazer a genômica para o blockchain permitiria a circulação necessária para acelerar a pesquisa, ao mesmo tempo em que protege essas informações exclusivamente pessoais, mantendo identidades anonimizadas separadas dos identificadores criptográficos. Os usuários permanecem no controle de seus dados e decidem exatamente com quem são compartilhados e com quais objetivos. Esse acesso, por sua vez, seria rastreado em um ledger auditável e imutável.

Grishin descreveu a versão do Nebula, que colocaria requisitos assimétricos em diferentes membros do ecossistema. Os usuários teriam a opção de permanecer anônimos, mas um sistema de blockchain de permissão com nós validadores verificados exigiria que os compradores de dados que usam a rede fossem totalmente transparentes sobre sua identidade:

“Se alguém se aproximar de você, não deve ser apenas um ID de rede criptográfico, mas deve dizer que esse é John Smith, da Johnson & Johnson, que trabalha, digamos, em oncologia.”

Grishin acrescentou que a Nebula experimentou tanto o blockstack quanto o blockchain Ethereum (ETH), mas desde então decidiu se mudar para um protótipo interno, considerando que a capacidade de 15 transações por segundo do Ethereum é insuficiente para seu ecossistema.

O Brama da DNABits, também comprometido com o uso de um sistema de permissão, propôs usar "a forma mais simples e robusta de blockchain - ou seja, uma rede do tipo Bitcoin".

“Quanto mais poderoso e mais eficiente o mecanismo que você usa, maior o ataque à superfície.”

Blockchain à prova de mentiras

Diz-se que o 23andMe armazena cerca de cinco milhões de genótipos de perfis de clientes e a empresa rival Ancestry.com, cerca de 10 milhões. Para cada perfil, eles coletam cerca de 300 pontos de dados fenotípicos - criando pesquisas que visam descobrir quantos cigarros você (pensou) você fumou durante a sua vida ou se a ioga ou o Prozac foram mais eficazes no controle da depressão.

Um fenótipo é o conjunto de características observáveis de um indivíduo que resulta da interação de seu genótipo com seu ambiente. Gerar e compartilhar o acesso a esses dados é crucial para decodificar o genoma através de uma correlação de variantes e características. Mas, como Grishin observa, sendo amplamente autorrelatada, a qualidade de grande parte dos dados existentes é incerta, e uma genômica simbólica enfrenta um obstáculo a esse respeito:

“Se as pessoas conseguirem monetizar seus dados genômicos pessoais, então você pode imaginar que algumas pessoas podem pensar: 'Se eu alegar ter uma condição rara, muitas empresas farmacêuticas estarão interessadas em comprar acesso ao meu genoma' - que é apenas não necessariamente verdade. O valor de um genoma é difícil de prever e não é correto dizer que, se você tem algo raro, seu genoma será mais valioso. De fato, muitos estudos precisam de muitas amostras de controle que são apenas normais”.

A educação pode ajudar a conscientizar as pessoas de que elas não ganharão mais dinheiro mentindo e que um genoma intermediário pode ser tão interessante para um comprador quanto um incomum. Mas Grishin também observou que um sistema blockchain pode oferecer mecanismos únicos que impedem o engano, mesmo quando a educação falha:

“Blockchain pode ajudar a criar levantamentos fenotípicos que detectam respostas incorretas ou identificam onde um participante individual tentou mentir. E isso pode ser combinado com sistemas de depósito habilitados para blockchain, onde, por exemplo, antes de participar de uma pesquisa, você tem que depositar uma pequena quantidade de criptomoeda em uma carteira de garantia.”

Se as respostas conflitantes indicarem que alguém tentou mentir sobre sua condição médica, seu depósito poderia ser suspenso de uma maneira muito mais fácil de implementar dentro de um sistema blockchain do que em comparação a um usando moedas fiduciárias.

2018: Vírus e cromossomos atingem o blockchain

Mesmo com apenas uma fração da população a bordo, dada a intensificação dos dados do código do corpo, um tsunami de sequência já está inundando as lojas centralizadas existentes.

O conjunto de dados complexos e crus de um único genoma chega a 200 gigabytes: em junho de 2017, o GenBank do Instituto Nacional de Saúde dos EUA continha mais de dois trilhões de bases de sequência. Uma das maiores empresas de biotecnologia do mundo, a chinesa BGI Genomics, anunciou no mesmo mês que planeja produzir cinco petabases de novo DNA em 2017, aumentando a cada ano para atingir 100 petabases até 2020.

Em sua entrevista para a Cointelegraph, Lidsky propôs que o conjunto de dados bruto de 200 gigabytes é desnecessário para os analistas, enfatizando que o sequenciamento inicial do genoma é lido várias vezes "digamos 30 ou 100 vezes", para atenuar as imprecisões. Uma vez combinado, ele explicou, “o tamanho da sequência é reduzido para 1,5 gigabytes”. Isso ainda requer uma compressão significativa para trazê-lo para o blockchain. Como referência, o tamanho médio de uma transação na blockchain do Bitcoin (BTC) foi de 423 kilobytes, a partir de meados de junho de 2018.

Average transaction size on the Bitcoin blockchain, 2014-18

Tamanho da transação média no blockchain do Bitcoin, 2014-18. Fonte: TradeBlock.com

Em junho, a DNAtix anunciou a primeira transferência de um cromossomo completo usando a tecnologia blockchain - especificamente a malha Hyperledger da IBM. Lidsky disse à Cointelegraph que a empresa conseguiu uma taxa de compressão de 99% para o DNA em agosto.

A Nebula, por sua vez, prevê que, mesmo em uma blockchain, a transferência de dados é desnecessária e imprudente, dada a sensibilidade única da genômica. Propõe compartilhar o acesso a dados. A solução combinaria o blockchain com técnicas avançadas de criptografia e métodos de computação distribuída. Como Grishin descreveu:

“Seus dados podem ser analisados ​​localmente em seu computador, basta você executar um aplicativo em seus dados você mesmo [...] com medidas de segurança adicionais em vigor - por exemplo, usando criptografia homomórfica para compartilhar dados de forma criptografada.”

Grishin explicou que as técnicas homomórficas criptografam os dados, mas asseguram que não é "sem sentido" - criando "transformações que transformam os dados sem perturbá-los":

“O comprador de dados não recebe os dados subjacentes em si, mas computa em sua forma criptografada para obter resultados a partir dele. O código está, portanto, sendo transferido para os dados, em vez de os dados serem movidos para os pesquisadores ”.

Dados criptografados podem ser disponibilizados para os desenvolvedores dos chamados aplicativos genômicos - algo que a Nebula, a DNAtix e muitas outras startups emergentes no campo propõem como um meio de fornecer aos usuários uma interpretação de seus dados. Eles também podem fornecer uma fonte adicional de monetização para pesquisadores e outros desenvolvedores de terceiros.

Mas é "terceirização" interpretação genômica para um aplicativo tão simples? O modelo de assistência médica de décadas de idade encaminhava os pacientes a conselheiros genéticos para superarem os riscos e falarem sobre expectativas, ajudando a traduzir o que pode ser um resultado desconcertante e muitas vezes assustador.

As empresas de testes genéticos de consumidores já foram acusadas de deixar seus clientes “com muitos dados e poucas respostas”. Além de satisfazer a curiosidade genealógica e interpretar uma variedade de genes de “bem-estar”, o 23andMe pode revelar se você carrega uma variante genética que poderia impactar o seu filho. saúde futura e, até 2017, tem sido autorizada a divulgar riscos genéticos para a saúde, inclusive para o câncer de mama e Parkinson.

Blockchain pode não se sair muito melhor quando se trata de deixar as pessoas no escuro, confrontadas com o brilho azul de suas telas de computador. Nebula e DNAtix estão considerando como integrar os conselheiros genéticos em seus ecossistemas, e Grishin também propôs que os usuários seriam capazes de “optar” por saber se realmente querem “saber tudo”, ou apenas querem insights “acionáveis” - isto é, coisas que a medicina moderna pode abordar.

Blockchain e big pharma

Prev+e-se que as vendas globais de medicamentos com receita médica cheguem a US $ 1,2 trilhão até 2024. Mas fechar o ciclo de feedback entre os produtos farmacêuticos e os milhões de pessoas que tomam suas pílulas todos os dias ainda enfrenta obstáculos significativos.

O desenvolvimento de medicamentos depende da correlação e do rastreamento do ciclo de vida de exames médicos, testes genéticos, efeitos colaterais de prescrição e efeitos de longo prazo relacionados ao estilo de vida; A tokenização pode incentivar indivíduos e empresas a compartilhar dados gerados em vários fluxos. Como Brama descreveu:

“Dados de estilo de vida vêm de wearables, smartphones, casas inteligentes, cidades inteligentes, compras, interações comerciais, mídias sociais, etc. Outro é carregado por todos, e esse é o nosso genoma. A terceira são dados clínicos e de saúde gerados no sistema de saúde.”

Brama usou a analogia de um baralho de cartas para explicar como blockchain poderia ser a chave para começar a colocar esses dados em conexão, protegendo o anonimato dos proprietários de dados.

Um indivíduo pode ter um número ilimitado de endereços únicos em sua carteira digital. Entrar em uma farmácia para comprar uma droga específica - digamos, vitamina C, carimbada com um código QR - geraria uma transação para um desses endereços. Uma visita a um médico de família pode gerar mais problemas para um diagnóstico em seu prontuário eletrônico (EMR) - digamos, um nariz escorrendo. Essa transação vai entre o cuidador e outro endereço da carteira.

Um usuário pode optar por colocar a correlação entre transações para suas diferentes carteiras no blockchain e torná-la pública para que as pessoas façam lances nos dados subjacentes. Ou, eles podem manter a correlação off-chain e enviar prova somente quando, por exemplo, uma empresa de seguros ou instituto de pesquisa anunciar para usuários que possuem um conjunto específico de transações:

“Você segura o convés. Você olha para as cartas, você decide se você diz, se você não diz. E você pode colocá-los na mesa e deixar todos verem, ou você pode indicar em particular que você realmente os tem. Isso realmente deixa a escolha e a implementação para você.”

Fronteiras biotecnológicas

O professor Church fez uma analogia que provavelmente soa bem para qualquer um conectado ao espaço da criptografia e do blockchain, dizendo que “neste momento, o sequenciamento do genoma é como a internet no final dos anos 80. Estava lá, mas ninguém estava usando.

A blockchain e a vanguarda da pesquisa genômica talvez tenham se aproximado mais do que nunca. Agora que o DNA em nossas células é entendido como um repositório de informações ao longo da vida, é necessária uma tecnologia nova e disruptiva para gerenciar com segurança e flexibilidade as redes interligadas do código do corpo.

O advento da genômica levanta questões que não podem ser resolvidas apenas pela ciência. Para todos os nossos entrevistados, blockchain poderia ser apenas a chave para criar os meios de propriedade e circulação transparentes e equitativos que garantiriam que esses hélices do biomaterial bruto não saiam de controle.