Como a ciência de dados está transformando a microbiologia

Ciência de dados, biologia computacional, bioinformática: já faz alguns anos que a Biologia anda de mãos dadas com a geração e análise de grandes volumes de dados. Cada vez mais a ciência entende o código genético como algo a ser digitalmente processado e esse avanço tem gerado novos caminhos e entendimentos sobre o impacto do DNA nas características e papéis dos seres vivos frente aos ecossistemas.

No caso do microbioma, vem crescendo a visão sobre seu caráter sistêmico, em que microrganismos estão integrados entre si e a hospedeiros e ambientes, em um emaranhado genético resultante da coevolução e dependência para sobrevivência. Essa perspectiva também tem impulsionado o desenvolvimento de produtos biológicos que consideram a complexidade dos microbiomas e seu potencial para originar novas e inovadoras tecnologias para a agricultura e medicina.

Para entender melhor sobre as transformações pelas quais a Microbiologia tem passado nos últimos anos, Crhisllane Vasconcelos, Lead Data Scientist da Symbiomics, respondeu a algumas perguntas sobre como a genômica, a bioinformática e a análise de dados estão transformando o que entendemos sobre os microrganismos e suas aplicações biotecnológicas.

 

A visão sobre a microbiologia mudou muito nos últimos anos. O que a genômica tem a ver com isso?

Os pioneiros da microbiologia utilizavam fontes de nutrientes sólidas para isolar e identificar os microrganismos. Essa é uma frase bonita para dizer que tudo começou com cultivo de bactérias em fatias de batatas ou gelatinas, o que permite visualizar e contar colônias desses organismos. Essas técnicas de isolamento foram aprimoradas e são utilizadas até hoje na microbiologia. Por quase 300 anos, o estudo dos microrganismos foi realizado através de características morfológicas e da seleção de alguns perfis bioquímicos, algo que só mudou com o surgimento dos estudos genômicos

Nos últimos 20 anos, a utilização de técnicas genômicas levou à identificação de uma diversidade microbiana até então desconhecida, e os avanços dessas técnicas têm permitido, ainda, mapear variações metabólicas entre cepas bacterianas. Isso é, hoje temos não só o genoma completo de uma ampla diversidade de microrganismos, como também podemos correlacionar mudanças na expressão dos genes a ambientes diferentes.

 

Quais novas aplicações biotecnológicas já existem a partir dessas mudanças?

As aplicações são múltiplas e em diversas áreas. A utilização das tecnologias genômicas nos laboratórios de microbiologia médica, por exemplo, permite a detecção de microrganismos não cultiváveis, o rastreamento de mutações em genomas de microorganismos resistentes a antibióticos, além do rápido monitoramento de linhagens virais e suas mutações durante períodos de pandemia, algo que temos vivenciado nos últimos anos.

Indo além dos laboratórios médicos, o impacto da genômica na microbiologia é tão amplo que permite desde a identificação de genes presentes em comunidades microbianas associadas a plantas – para a busca de microrganismos que auxiliam as plantas na tolerância ao estresse hídrico, por exemplo – até a avaliação do impacto de fatores espaciais – como gravidade, radiação, perturbação circadiana e pressão atmosférica – em plantas e microrganismos submetidos a voos espaciais.  

 

Dizem que o avanço da ciência da computação é exponencial. Agora que biologia e ciência de dados estão se desenvolvendo juntas, dá para prever o que vem por aí?

Em 2000 foi publicado um artigo na revista Science sobre o futuro da bioinformática, e nele é possível ler a seguinte frase: “Qualquer um que faça qualquer biologia molecular certamente precisará fazer bioinformática”. E é basicamente isso que vivemos hoje, 22 anos depois. Atualmente, para se trabalhar com biologia molecular, é necessário um mínimo de conhecimento em bioinformática e ciência de dados.

Para o futuro vejo algo análogo a isso, integrando as ferramentas de aprendizagem de máquina, algo que no artigo de 2000 não era nem pensado. Qualquer um que venha a trabalhar com biologia molecular deverá ter um mínimo de conhecimento sobre inteligência artificial. Isso porque provavelmente teremos abordagens similares ao AlphaFold, por exemplo, o programa de inteligência artificial desenvolvido pela Google, para previsões da estrutura de proteínas, direcionadas para diversas áreas, incluindo as áreas clínicas. Ou seja, daqui em diante, serão cada vez mais comuns ferramentas que se utilizam da inteligência artificial, sendo capazes de mudar e impactar determinados setores, como o AlphaFold impactou a predição de estrutura de proteínas.

 

As universidades e instituições de pesquisa brasileiras estão acompanhando essas mudanças?

Para se ter uma ideia, o Brasil ficou entre os 30 países de maior impacto e qualidade nas publicações de bioinformática, ocupando a 26ª posição, em um levantamento realizado em 2020. Esse estudo considerou a relevância de trabalhos científicos na área com base no número de publicações e também de suas citações. Não é uma boa colocação, mas não é das piores. 

 

Metagenômica e transcriptômica são o que há de mais avançado em ciência envolvendo estudos em microbioma? Quais novas ferramentas e conhecimentos estão emergindo e o que possibilitam?

O termo metagenoma foi utilizado pela primeira vez em 1998 referindo-se ao conjunto de genomas de bactérias e fungos em amostras ambientais. O estudo dos metagenomas permite descrever apenas a presença de microorganismos e de seus genes, faltando o acesso a uma informação crucial, sobre a expressão de seus genes. Assim, para extrair insights mais profundos sobre o comportamento de uma determinada comunidade microbiana – frente a variações ambientais, por exemplo – é necessário utilizar a metatranscriptômica, que se refere ao estudo do conjunto dos transcritos expressos por essa comunidade.

No entanto, o que temos de ainda mais avançado hoje é a união das áreas “ômicas”. Isso envolve, por exemplo: a integração da metagenômica com dados genéticos dos microrganismos em um determinado ambiente, da metatranscriptômica com dados de expressão de transcritos em uma comunidade microbiana a nível de RNA, a metaproteômica caracterizando essa expressão gênica a nível de proteína, e a metabolômica identificando o resultado dos processos metabólicos. A ligação de todas essas áreas permitirá uma compreensão maior acerca do real comportamento de uma comunidade microbiana em um ambiente.

Contact Symbiomics Contacte a Symbiomics