O genoma humano é o catálogo completo da informação genética transportada por humanos. O Projeto Genoma Humano iniciou o processo de identificação e mapeamento sistemático de toda a estrutura do DNA humano em 1990. O primeiro genoma humano completo foi publicado em 2003 e o trabalho continua. O projeto identificou mais de 20.000 genes codificadores de proteínas espalhados entre os 23 pares de cromossomos encontrados em humanos.
No entanto, esses genes representam apenas cerca de 1,5 por cento do genoma humano. Vários tipos de sequência de DNA foram identificados, mas muitas questões permanecem.
Genes codificadores de proteínas
Os genes que codificam proteínas são sequências de DNA que as células usam para sintetizar proteínas. O DNA consiste em uma longa estrutura de açúcar-fosfato, da qual pendem quatro moléculas menores chamadas bases. As quatro bases são abreviadas como A, C, T e G.
A sequência dessas quatro bases ao longo das porções codificadoras de proteínas da estrutura do DNA corresponde a sequências de aminoácidos, os blocos de construção das proteínas. Os genes codificadores de proteínas especificam proteínas que determinam a estrutura física dos humanos e controlam a química do nosso corpo.
Seqüências regulatórias de DNA
Células diferentes precisam de proteínas diferentes em momentos diferentes. Por exemplo, as proteínas necessárias a uma célula cerebral podem ser muito diferentes daquelas necessárias a uma célula hepática. Uma célula deve, portanto, ser seletiva quanto às proteínas que precisa para fabricar.
Seqüências regulatórias de DNA combinam-se com proteínas e outros fatores para controlar quais genes estão ativos em um determinado momento. Eles também servem como marcadores que identificam o início e o fim dos genes. Por meio de processos bioquímicos e mecanismos de feedback, as sequências regulatórias de DNA controlam a expressão gênica.
Genes para RNA não codificante
O DNA não produz proteínas diretamente. O RNA, uma molécula relacionada, serve como intermediário. Os genes do DNA são primeiro transcritos em RNA mensageiro, que então carrega o código genético para locais de fábricas de proteínas em outras partes da célula.
O DNA também pode transcrever moléculas de RNA que não codificam proteínas, que a célula usa para uma variedade de funções. Por exemplo, o DNA é o modelo para um tipo importante de RNA não codificante usado para construir as fábricas de proteínas encontradas em toda a célula.
Íntrons
Quando um gene é transcrito em RNA, partes do RNA podem precisar ser removidas porque contêm informações desnecessárias ou confusas. As sequências de DNA que codificam esse RNA desnecessário são chamadas de íntrons. Se o RNA criado por íntrons em genes codificadores de proteínas não fosse separado, a proteína resultante seria malformada ou inútil.
O processo de splicing de RNA é bastante notável - a bioquímica celular deve saber do intron existência, localizar precisamente sua sequência em uma fita de RNA e, em seguida, extirpá-la exatamente no locais.
Vast Wasteland
Os cientistas não sabem a função de uma grande porcentagem das sequências de bases em uma molécula de DNA. Alguns podem ser apenas lixo, enquanto outros podem desempenhar papéis ainda não compreendidos.