Cientista descobre sequências iniciais de coronavírus que foram misteriosamente deletadas

Por Marcelo Ribeiro, em 25.06.2021

Cerca de um ano atrás, mais de 200 entradas de dados do sequenciamento genético de casos precoces de Covid-19 em Wuhan sumiram de um banco de dados científico online.

Agora, ao vasculhar arquivos armazenados no Google Cloud, um pesquisador em Seattle relata que recuperou 13 dessas sequências originais; intrigantes novas informações para discernir quando e como o vírus pode ter vindo de um morcego ou outro animal para humanos.

A nova análise, divulgada na terça-feira, reforça sugestões anteriores de que uma variedade de coronavírus pode ter circulado em Wuhan antes dos surtos iniciais ligados aos mercados de animais e frutos do mar em dezembro de 2019.

O estudo não reforça nem descarta a hipótese de que o patógeno vazou de um famoso laboratório de Wuhan. Mas levanta questões sobre por que as sequências originais foram excluídas, e sugere que pode haver mais revelações para serem descobertas pela internet.

Jesse Bloom, virologista do Centro de Pesquisa do Câncer Fred Hutchinson que redigiu o novo relatório, chamou a exclusão dessas sequências de suspeita. “Parece provável que as sequências foram excluídas para obscurecer sua existência”, escreveu ele no artigo, que ainda não foi revisado por pares ou publicado em revista científica.

Bloom e Dr. Worobey pertencem a um grupo de cientistas que pediram por investigações de como a pandemia começou. Em uma carta publicada em maio, eles reclamaram que não havia informações suficientes para determinar se era mais provável que um vazamento de laboratório tivesse espalhado o coronavírus, ou se ele passou para humanos através de contato com um animal infectado fora de um laboratório.

As sequências genéticas de amostras virais guardam pistas cruciais sobre como o SARS-CoV-2 passou para nossa espécie vinda de outro animal, provavelmente um morcego. A mais preciosa de todas são sequências do início da pandemia, porque eles levam os cientistas mais perto do evento original.

Enquanto o Dr. Bloom revisava quais dados genéticos haviam sido publicados por vários grupos de pesquisa, ele se deparou com um estudo de março de 2020: uma planilha que incluía informações sobre 241 sequências genéticas coletadas por cientistas da Universidade de Wuhan. A planilha indicou que os cientistas haviam cadastrado as sequências em um banco de dados online chamado Sequence Read Archive, gerenciado pela Biblioteca Nacional de Medicina do governo dos EUA.

Mas quando o Dr. Bloom procurou as sequências de Wuhan no banco de dados no início deste mês, seu único resultado foi “nenhum item encontrado”.

Intrigado, ele voltou para a planilha para mais pistas. Ele indicou que as 241 sequências foram coletadas por um cientista chamado Aisi Fu no Hospital Renmin em Wuhan. Pesquisando a literatura médica, o Dr. Bloom finalmente encontrou outro estudo publicado online em março de 2020 pelo Dr. Fu e colegas, descrevendo um novo teste experimental para SARS-CoV-2. Os cientistas chineses publicaram em uma revista científica três meses depois.

Nesse estudo, os cientistas escreveram que analisaram 45 amostras de swabs nasais retiradas “de pacientes ambulatoriais com suspeita de Covid-19 no início da epidemia”. Eles então procuraram por uma porção do material genético do SARS-CoV-2 nos swabs. Os pesquisadores não publicaram as sequências reais dos genes que eles coletaram das amostras. Em vez disso, eles só publicaram algumas mutações nos vírus.

Mas uma série de pistas indicaram ao Dr. Bloom que as amostras eram a fonte das 241 sequências perdidas. Os artigos não incluíam nenhuma explicação sobre por que as sequências foram enviadas para o Sequence Read Archive, e desapareceram depois.

Examinando o arquivo, o Dr. Bloom descobriu que muitas das sequências foram armazenadas como arquivos no Google Cloud. Cada sequência estava em um arquivo separado, e os nomes dos arquivos possuíam o mesmo formato básico, relatou.

Bloom trocou o código por uma sequência perdida de Wuhan. De repente, ele encontrou a sequência. Ao todo, ele conseguiu recuperar 13 sequências desta maneira.

Com esses novos dados, o Dr. Bloom olhou mais uma vez para os estágios iniciais da pandemia. Ele combinou as 13 sequências com outras sequências iniciais publicadas de coronavírus, na esperança de fazer progressos na construção da árvore genealógica do SARS-CoV-2.

Trabalhar em todas as etapas pelas quais o SARS-CoV-2 evoluiu a partir de um vírus morcego tem sido um desafio porque os cientistas ainda têm um número limitado de amostras para estudar. Algumas das primeiras amostras vêm do Mercado atacadista de frutos do mar de Huanan em Wuhan, onde um surto ocorreu em dezembro de 2019.

Mas esses vírus do mercado têm três mutações extras que estão faltando em amostras SARS-CoV-2 coletadas semanas depois. Em outras palavras, esses vírus posteriores se parecem mais com coronavírus encontrados em morcegos, apoiando a ideia de que havia alguma linhagem precoce do vírus que não passou pelo mercado.

Bloom descobriu que as sequências excluídas que ele recuperou da nuvem também não têm essas mutações extras. “São três passos mais semelhantes aos coronavírus de morcegos do que os vírus do mercado”, disse o Dr. Bloom.

Isso sugere, segundo ele, que quando o SARS-CoV-2 chegou ao mercado, ele já estava circulando há algum tempo em Wuhan ou mais do que isso. Os vírus do mercado, argumentou, não são representativos da diversidade total de coronavírus espalhados no final de 2019.

“Talvez nossa idéia do que estava presente no início de Wuhan do que foi sequenciado possa ser um pouco tendenciosa”, disse ele.

Em seu relatório, o Dr. Bloom reconheceu que essa conclusão teria que ser confirmada com uma análise mais profunda das sequências do vírus. Worobey disse que ele e seus colegas estão trabalhando em um estudo em larga escala de genes SARS-CoV-2 para entender melhor sua origem e que agora eles adicionarão as 13 sequências recuperadas do Dr. Bloom.

“Esses dados adicionais desempenharão um grande papel nesse esforço”, disse o Dr. Worobey.

Não está claro por que essa informação valiosa desapareceu em primeiro lugar. Cientistas podem solicitar que os arquivos sejam excluídos enviando um e-mail para os gerentes do Sequence Read Archive. A Biblioteca Nacional de Medicina (EUA), que administra o arquivo, disse que as 13 sequências foram removidas no verão passado.

“Essas sequências do SARS-CoV-2 foram submetidas à postagem na SRA em março de 2020 e posteriormente solicitadas a serem retiradas pelo investigador em junho de 2020”, disse Renate Myles, porta-voz dos Institutos Nacionais de Saúde (EUA).

Ela disse que o investigador, não citado, disse aos gerentes de arquivo que as sequências estavam sendo atualizadas e seriam adicionadas a um banco de dados diferente. Mas o Dr. Bloom pesquisou todos os bancos de dados que conhece, e ainda não os encontrou. “Obviamente, não posso descartar que as sequências estejam em algum outro banco de dados ou página web em algum lugar, mas não consegui encontrá-las em nenhum dos lugares óbvios que procurei”, disse ele.

Alguns cientistas estão céticos de que há algo sinistro por trás da remoção das sequências. “Eu realmente não entendo como isso indica uma ocultação”, disse Stephen Goldstein, virologista da Universidade de Utah.

Goldstein observou que o artigo do teste listava as mutações individuais que os pesquisadores de Wuhan encontraram em seus testes. Embora as sequências completas não estejam mais no arquivo, as principais informações são públicas há mais de um ano, disse ele, mas estava oculto em um formato que é difícil para os pesquisadores descobrirem.

“Não podemos realmente dizer por que eles foram removidos”, reconheceu o Dr. Bloom em uma entrevista. “Podemos dizer que a consequência prática de removê-los foi que as pessoas não notaram que [as sequências] existiam.” Ele também observou que o governo chinês ordenou a destruição de uma série de amostras iniciais do vírus e barrou a publicação de artigos sobre o coronavírus.

Independentemente do que aconteceu com essas 13 sequências, o Dr. Bloom agora se pergunta quais outras pistas podem ser descobertas online. Para reconstruir a origem do Covid-19, todas essas pistas importam.

“Idealmente, precisamos tentar encontrar o maior número possível de sequências iniciais”, disse ele. “E eu acho que este estudo sugere que devemos procurar em todos os lugares.” [The New York Times]

Deixe seu comentário!

Cancelar resposta

Você precisa fazer o login para publicar um comentário.

Leia também

Deixe seu comentário!