Se os meios atuais de armazenamento de informações não fossem mais suficientes, qual seria a próxima etapa evolutiva nesse sentido? Cientistas e pesquisadores acreditam que compreender como o DNA pode revolucionar o armazenamento de dados é o passo seguinte nessa escala evolutiva.

A quantidade de informações produzidas pelos seres humanos é cada vez maior. Todos os anos, o volume tem crescido a uma proporção astronômica a ponto de os especialistas se preocuparem com o fato de que as tecnologias disponíveis hoje não serão capazes de suprir as necessidades de armazenamento do futuro.

A ideia de utilizar o DNA para guardar informações não é nova, mas além de esse ser um processo complexo ele também é caro. Porém, o trabalho da startup norte-americana Catalog pode ajudar a desenvolver essa tecnologia e torna-la viável em um futuro próximo.

O espaço de armazenamento vai acabar? Como assim?

Calma, não há motivo para pânico. Porém, vamos analisar essa questão da seguinte forma: quando você salva um arquivo na nuvem, esse arquivo ocupa um espaço em algum lugar, no caso um servidor remoto. Porém, quanto mais pessoas utilizarem essa tecnologia, mais espaço será necessário. E, nesse caso, falamos de espaços que são finitos.

Os números são assombrosos: 3,7 bilhões de pessoas usam a internet todos os dias e geram um total de 2,5 quintilhões de bytes. O mais curioso de tudo isso é imaginar que 90% desses dados foram gerados apenas nos últimos dois anos. Ou seja, nunca se produziu tanta informação como agora.

Seguindo as projeções, Hyunjun Park, CEO da Catalog, afirma que até 2025 estaremos produzindo um total de 160 zettabytes de informação, sendo que 1 zettabyte equivale a um trilhão de gigabytes. Com as técnicas de armazenamento que temos em dia, segundo ele, será possível armazenar apenas 12,5% disso. E aí, o que fazer com o restante da produção?

Codificar dados em moléculas de DNA pode ser a solução

Estudos realizados nos últimos anos mostram que é possível codificar sequências binárias em faixas de DNA sintético. Ou seja, aqueles “zeros e uns” que formam os arquivos, as imagens e os vídeos podem ser armazenados em estruturas similares ao DNA. Note que não estamos falando do DNA dos seres humanos, mas sim de uma estrutura criada em laboratório.

Esse DNA sintético é composto por sequências de bases nucleotídicas representadas pelas letras A, C, G e T. Assim, as informações são convertidas para esse código, permitindo que o DNA armazene as informações. Em um teste realizado em 2018, a Microsoft, em parceria com a Universidade de Washington, conseguiu colocar 200 MB de arquivos em DNA.

Posteriormente, esses código precisam ser acessados por máquinas de sequenciamento de DNA – e é justamente por isso que esse processo por enquanto é caro. Esse, aliás, é um dos dois problemas que tornam essa tecnologia ainda inacessível. O outro é lentidão na capacidade de processamento, pois são necessários computadores poderosos para dar conta dessa tarefa.

Para resolver esse problema, a Catalog pretende atuar diretamente na fase de sintetização das sequências, o ponto mais caro de todo o processo. O método consiste em gerar muitas combinações a partir de um número pequeno de moléculas. Esses fragmentos prontos e programáveis precisam apenas ser rearranjados, simplificando o processo.

O CEO da empresa afirma que a partir de 2019 o equipamento em desenvolvimento será capaz de codificar em DNA 1 TB de dados por dia. O custo disso seria de alguns milhões de dólares, mas isso seria positivo. Isso porque, apenas a título de comparação, as tecnologias conhecidas atualmente custam bilhões para realizar o mesmo trabalho em algumas semanas.

A questão de espaço também seria resolvida: em um DNA será possível salvar um milhão de vezes mais informações do que seria possível em uma memória flash. Por fim, o DNA tem uma durabilidade maior do que as demais tecnologias. Em outras palavras, resolvendo-se a questão dos custos, essa tecnologia tem tudo para ser a aposta da próxima década com relação ao armazenamento de dados.

Acesso à informação ainda é um problema a ser resolvido

As tecnologias de armazenamento de dados baseadas em DNA resolvem o problema de onde colocar tanta informação, mas ainda não resolvem a questão do acesso aos dados. Pela necessidade de decodificação das informações, acessar um simples arquivo pode levar algumas horas, algo que não é nada prático para o consumidor final.

É por essa razão que as primeiras experiências serão direcionadas às empresas que trabalham com arquivamento de dados de longo prazo. Nesse caso, o fator segurança é mais importante do que a frequência ou a velocidade de acesso a cada um dos arquivos. Hoje, muitas empresas utilizam as fitas magnéticas para armazenar esse tipo de informação.

Fonte(s): O Globo e Terra