Medicina Genomica Orientações para Agendamentos
Dra. Fernanda Teresa de Lima
O Que É o Genoma Humano: Quantos Genes Temos e o Que Ainda Não Sabemos Sobre Eles
Pacientes Genética Clínica

O Que É o Genoma Humano: Quantos Genes Temos e o Que Ainda Não Sabemos Sobre Eles

Imagine um livro de instruções com mais de três bilhões de letras, escrito em um alfabeto de apenas quatro símbolos, capaz de guiar a construção e o funcionamento de todo o seu corpo — desde a cor dos seus olhos até o modo como suas células se reparam depois de uma lesão. Esse livro existe, e ele está dentro de cada uma das suas células. É chamado de genoma humano.

O que é o genoma?

O genoma é o conjunto completo de informações genéticas de um organismo. No ser humano, ele está organizado em 23 pares de cromossomos — estruturas presentes no núcleo de quase todas as células do corpo — e é composto por aproximadamente 3,055 bilhões de pares de bases, que são as "letras" do código genético. As mulheres tem mais pares de bases do que os homens, porque tem dois cromossomos XX, enquanto o homem tem um cromossomo X e um Y, menorzinho.

Esse código é formado por apenas quatro moléculas, representadas pelas letras A, T, C e G, que representam moléculas chamadas de bases nitrogenadas – A de Adenina, T de Timina, C de Citosina e G de Guanina. A sequência em que essas letras se organizam ao longo do DNA é o que determina toda a informação biológica do organismo.

Quantos genes temos?

Esta é uma das perguntas que mais surpreende as pessoas quando descobrem a resposta. Durante décadas, cientistas estimaram que teríamos entre 50.000 e 100.000 genes. Quando o Projeto Genoma Humano foi concluído no início dos anos 2000, essa estimativa caiu drasticamente — e continuou caindo.

Ao longo dos anos desde a publicação do rascunho inicial do genoma humano, muito progresso foi feito na identificação de genes que codificam proteínas, e o número estimado encolheu para cerca de 20.000, embora o número de variantes distintas desses genes tenha se expandido dramaticamente.

Isso chama a atenção por um motivo simples: um verme microscópico como o C. elegans tem cerca de 20.000 genes — praticamente o mesmo número que nós. A complexidade humana, portanto, não está apenas em quantos genes temos, mas em como eles funcionam, interagem e se expressam.

Mas espera — "cerca de 20.000 genes" é pouco para toda a complexidade humana?

Sim, e essa é exatamente a pergunta que intriga os cientistas. A resposta está em um conceito chamado isoformas: um único gene pode dar origem a múltiplas versões de proteínas diferentes, dependendo de como ele é "lido" e processado pela célula.

Embora os cientistas tenham convergido para a identificação de cerca de 20.000 genes, esses genes podem ser cortados e recombinados para criar aproximadamente 100.000 proteínas diferentes — e os especialistas ainda estão longe de um consenso sobre quais são todas essas proteínas.

Ou seja: o número de genes é menor do que imaginávamos, mas a diversidade do que eles produzem é muito maior.

O genoma é só genes?

Não — e esta é uma das descobertas mais importantes das últimas décadas. Os genes que codificam proteínas correspondem a apenas 1% a 2% do genoma humano. O restante foi chamado por muito tempo de "DNA lixo" — uma expressão que hoje sabemos ser equivocada.

Análises de alta capacidade de características genômicas, como sequências transcritas e dinâmica de nucleossomos, levaram à conclusão de que a maior parte do genoma humano apresenta indícios de que são relacionados a alguma função bioquímica.

Grande parte desse DNA não codificante inclui os chamados genes de RNA não codificante — regiões que não produzem proteínas, mas que desempenham papéis importantes na regulação de outros genes. O avanço do sequenciamento de RNA em larga escala e outras conquistas tecnológicas levaram a uma rápida expansão no número de genes de RNA não codificante relatados — embora para a maioria deles a relevância funcional ainda não esteja clara. 

O genoma humano já foi completamente sequenciado?

Por muito tempo, a resposta era "quase". O Projeto Genoma Humano, concluído em 2003, havia mapeado cerca de 92% do genoma. Os 8% restantes ficaram em aberto por quase duas décadas — exatamente as regiões mais complexas e repetitivas, como os centrômeros e os telômeros dos cromossomos.

Em 2022, um marco histórico foi atingido. O Consórcio Telômero-a-Telômero (T2T) apresentou uma sequência completa de 3,055 bilhões de pares de bases do genoma humano, incluindo montagens sem lacunas para todos os cromossomos exceto o Y, corrigindo erros nas referências anteriores e introduzindo quase 200 milhões de pares de bases de sequência contendo 1.956 previsões de genes, dos quais 99 são previstos como codificadores de proteínas.

Em 2023, o sequenciamento do cromossomo Y foi finalmente completado, encerrando mais de 30 anos de trabalho e tornando o genoma humano o primeiro de um organismo complexo a ser lido de ponta a ponta — do telômero de um lado ao telômero do outro.

O que ainda não sabemos?

Muito. Conhecer a sequência do genoma é apenas o primeiro passo — é como ter o livro em mãos, mas ainda precisar aprender a lê-lo.

Muito trabalho ainda precisa ser feito antes de termos um padrão universal de anotação que inclua todos os genes com significado médico, mantenha suas relações com diferentes genomas de referência e descreva variantes genéticas clinicamente relevantes.

Além disso, cada ser humano é geneticamente único. A descoberta completa de variantes genéticas vai transformar a forma como mapeamos, catalogamos e associamos variações com doenças humanas, e mudará fundamentalmente nossa compreensão da diversidade genética de todos os seres humanos. 

Por que isso importa para a saúde?

O conhecimento do genoma humano está na base de uma revolução na medicina. Ele permite:

  • Identificar a causa genética de doenças raras que antes ficavam sem diagnóstico por anos
  • Descobrir predisposições hereditárias ao câncer, doenças do coração e outras condições, antes mesmo de os sintomas aparecerem
  • Desenvolver tratamentos mais precisos, ajustados ao perfil genético de cada paciente
  • Criar terapias gênicas que corrigem diretamente a causa de certas doenças

O genoma humano é, ao mesmo tempo, o mapa mais detalhado que temos da nossa biologia e um dos maiores quebra-cabeças que a ciência ainda está montando. Cada novo gene identificado, cada variante classificada, cada região antes obscura que ganha função conhecida — tudo isso nos aproxima de uma medicina mais precisa, mais preventiva e mais humana.

Referências

  1. Amaral P et al. The status of the human gene catalogue. Nature. 2023;622(7981):41–47. PMID: 37794265.
  2. Nurk S et al. The complete sequence of a human genome. Science. 2022;376(6588):44–53. PMID: 35357919.
  3. Mattick J & Amaral P. The Human Genome.In: ___________. RNA, the Epicenter of Genetic Information: A new understading of molecular biology. Abdingdon: CRC Press; 2022. Disponível em: https://www.ncbi.nlm.nih.gov/books/NBK595930/.
  4. Miga KH & Eichler EE. Envisioning a new era: Complete genetic information from routine, telomere-to-telomere genomes. Am J Hum Genet. 2023; 110(11):1832-40. PMID: 37922882.
  5. Ezkurdia I et al. Multiple evidence strands suggest that there may be as few as 19,000 human protein-coding genes. Hum Mol Genet. 2014;23(22):5866-78. PMID: 24939910.

6.       Varabyou et al. CHESS 3: An improved, comprehensive catalog of human genes and transcripts based on large-scale expression data, phylogenetic analysis, and protein structure. Genome Biol 2023;24(1):249. PMID: 37904256.

7.       Piovesan et al. Human protein-coding genes and gene feature statistics in 2019. BMC Res Notes 2019;12(1):315. PMID: 31164174.

Pacientes Médicos Contato