Home  >  Inovação

Com cloud e IA, Brasil ganhará primeiro banco de sequenciamento genético

Projeto DNA do Brasil é encabeçado por uma das principais cientistas brasileiras e conta com parceria da Dasa e Google Cloud

Carla Matsu

10/12/2019 às 16h24

Foto: Shutterstock

O Brasil caminha para ter o seu primeiro banco de sequenciamento genético em escala. Nesta terça-feira (10/12), as geneticistas Lygia da Veiga Pereira e Tábita Hünemeier, ambas do Instituto de Biociências da USP, anunciaram o projeto DNA do Brasil, um consórcio entre universidades e empresas que se compromete a sequenciar o genoma de uma parcela da população brasileira. A iniciativa conta com a colaboração do Google Cloud e da gigante de laboratórios Dasa.

O projeto tem um peso importante para a ciência e medicina brasileiras. Afinal, o País ainda não conta com um banco genético que reflita a sua população. Atualmente, os bancos genéticos disponíveis são, de forma geral, o saldo de um mapeamento das populações europeias e asiáticas. Por conta de sua miscigenação resultada de fluxos migratórios, o Brasil é um país também diverso do ponto de vista genético. Ter esse genoma mapeado é um passo e tanto para descobrir marcadores genéticos que são relacionados à doenças e, consequentemente, desdobrar tratamentos e medicamentos mais assertivos, assim como prevenção.

Uma das mais importantes cientistas brasileiras, Lygia fez parte do grupo que sequenciou o genoma humano. Ela também esteve à frente da equipe que criou a primeira linhagem de células-tronco embrionárias desenvolvidas no Brasil. “O DNA do Brasil dá início a uma nova fase dos estudos nacionais e globais sobre genômica. Vamos gerar informações sobre características genéticas que podem impactar diretamente na saúde da população”, explica Lygia.

Colaboração entre universidades

Apesar de ser lançado hoje, o DNA do Brasil é um projeto que retoma a alguns anos. Isso porque, ele recorrerá ao Estudo Longitudinal de Saúde do Adulto (ELSA Brasil), tido como a maior pesquisa epidemiológica do País, financiada pelos Ministérios da Saúde e CTIC. Tal estudo tem acompanhado clinicamente, desde 2008, um grupo de 15 mil brasileiros de diversas regiões do Brasil e com idades entre 35 e 74 anos. Suas conclusões permitiram destacar as doenças cardiovasculares e diabetes na agenda da pesquisa epidemiológica no país.

Agora, as informações genéticas desse grupo serão agregadas ao banco de dados do DNA do Brasil. Inicialmente, o projeto irá fazer o sequenciamento genético de 3 mil pessoas deste grupo. A expectativa é que o projeto tenha a duração de 10 anos e consiga sequenciar o genoma das 15 mil pessoas. Por trás dos esforços do ELSA, estão as Universidades Federal da Bahia, do Espírito Santo, de Minas Gerais, do Rio Grande do Sul e a Fiocruz (RJ).

Sem tecnologia, não há escala

A Dasa fará o sequenciamento das amostras em um equipamento que sequencia o genoma humano em até 24 horas. Há ainda o apoio da Illumina, que fornecerá os insumos utilizados no sequenciamento das amostras. Já o Google Cloud entra como parceiro tecnológico. É na nuvem do Google que serão processados os dados para obter o sequenciamento genético dos integrantes do ELSA.

“Nossa nuvem permite processar dados genômicos em grandes volumes”, comenta João Bolonha, diretor de Google Cloud Brasil.

Ao mesmo tempo, ao levar as cargas de trabalho para a nuvem, a iniciativa conseguirá analisar e cruzar dados por meio de ferramentas de analytics e inteligência artificial e, consequentemente, encontrar padrões entre os genomas de participantes, assim como correlações com marcadores de outros bancos de dados mundo afora.

Outro ponto importante diz respeito a custos. Com a adoção da nuvem, diz o Google, o custo de processamento necessário para o projeto DNA Brasil cairá 90%, quando comparado ao uso de infraestrutura própria de data center.

Haroldo Gali, executivo de vendas do Google Cloud, conta que a entrada da gigante de tecnologia no projeto tem papel de conseguir escalar a proposta da professora Lygia, entregando também camadas de segurança.

"É um trabalho complexo e extremamente caro. Foi onde entramos nesta história. O Google Cloud consegue ajudar a diminuir os custos de processamento e análise", destaca Gali.

Se de um lado a genômica, ramo da genética que estuda o genoma de um organismo, é fascinante, de outro, é extremamente complexa. Gali explica que cada pessoa pode ter 500 GB de informação genética. No caso do projeto DNA do Brasil, trabalhará-se com 30 GB de informação. Isso se reflete em uma explicação biológica: 99,9% do nosso genoma é idêntico. Segundo o Projeto Genoma Humano, o que diferencia as características particulares de cada pessoa é o 0,01% restante.

Levar esse processamento para a nuvem, diz Gali, é essencial. "Há uma série de requisitos [de conformidade] que encarecem uma infraestrutura deste tipo. Outro ponto importante é que se eu fizer isto em um data center on premise, quem garantiria a criptografia desses dados?", questiona o executivo.

E por falar em criptografia, levar dados do genoma humano pode soar à primeira vista algo sensível do ponto de vista da segurança das informações. Gali, entretanto, assegura que para além da criptografia, todos os dados do genoma dos participantes serão anonimizados. Não podendo abrir margem para, eventualmente, ser associados aos seus "proprietários".

Não é a primeira vez que o Google Cloud é usado para um projeto de fins genômicos. O Broad Institute, centro de pesquisa biomédica e genômica criado pela Harvard e MIT, utiliza a nuvem do Google e suas ferramentas analíticas.

Por que isso é tão importante

Nosso genoma é uma espécie de receita do que somos. É ele que define características como cor da pele, dos nossos olhos, altura e outros pormenores de nossa existência mais visível. Mas é ele também que estabelece a nossa disposição a certas doenças e como vamos envelhecer.

Investigá-lo, portanto, pode dar aos cientistas conclusões sobre variações ou mutações genéticas que serão valiosas para a medicina. Ao mesmo tempo, dá-se um novo horizonte de informações sobre o passado histórico do Brasil e do brasileiro.

Em última instância, o projeto também coloca o Brasil no mapa da genômica mundial e dá à comunidade científica um novo patamar de conhecimento para evoluir pesquisas em ciências biológicas e ciências humanas.