Il genoma umano è il catalogo completo delle informazioni genetiche trasportate dagli esseri umani. Il Progetto Genoma Umano ha iniziato il processo di identificazione e mappatura sistematica dell'intera struttura del DNA umano nel 1990. Il primo genoma umano completo è stato pubblicato nel 2003 e il lavoro continua. Il progetto ha identificato più di 20.000 geni codificanti proteine sparsi tra le 23 coppie di cromosomi trovate negli esseri umani.
Tuttavia, questi geni rappresentano solo l'1,5% circa del genoma umano. Sono stati identificati diversi tipi di sequenze di DNA, ma rimangono molte domande.
Geni che codificano le proteine
I geni che codificano le proteine sono sequenze di DNA che le cellule usano per sintetizzare le proteine. Il DNA è costituito da una lunga spina dorsale zucchero-fosfato, dalla quale pendono quattro molecole più piccole chiamate basi. Le quattro basi sono abbreviate come A, C, T e G.
La sequenza di queste quattro basi lungo le porzioni codificanti proteine della spina dorsale del DNA corrisponde a sequenze di amminoacidi, i mattoni delle proteine. I geni che codificano le proteine specificano le proteine che determinano la struttura fisica degli esseri umani e controllano la chimica del nostro corpo.
Sequenze di DNA regolatorie
Cellule diverse hanno bisogno di proteine diverse in momenti diversi. Ad esempio, le proteine necessarie a una cellula cerebrale potrebbero essere molto diverse da quelle necessarie a una cellula epatica. Una cellula deve quindi essere selettiva su quali proteine ha bisogno di produrre.
Le sequenze di DNA regolatorie si combinano con proteine e altri fattori per controllare quali geni sono attivi in un dato momento. Servono anche come marcatori che identificano l'inizio e la fine dei geni. Attraverso processi biochimici e meccanismi di feedback, le sequenze di DNA regolatorio controllano l'espressione genica.
Geni per RNA non codificante
Il DNA non produce direttamente le proteine. L'RNA, una molecola correlata, funge da intermediario. I geni del DNA vengono prima trascritti nell'RNA messaggero, che poi trasporta il codice genetico ai siti di fabbrica delle proteine in altre parti della cellula.
Il DNA può anche trascrivere molecole di RNA non codificanti proteine, che la cellula utilizza per una varietà di funzioni. Ad esempio, il DNA è il modello per un importante tipo di RNA non codificante utilizzato per costruire le fabbriche di proteine presenti in tutta la cellula.
introni
Quando un gene viene trascritto nell'RNA, potrebbe essere necessario rimuovere porzioni dell'RNA perché contengono informazioni non necessarie o confuse. Le sequenze di DNA che codificano per questo RNA non necessario sono chiamate introni. Se l'RNA creato dagli introni nei geni che codificano le proteine non fosse separato, la proteina risultante sarebbe malformata o inutile.
Il processo di splicing dell'RNA è piuttosto notevole: la biochimica cellulare deve conoscere gli introni esistenza, individuare con precisione la sua sequenza su un filamento di RNA e poi asportarlo esattamente a destra posti.
Vasta Landa Desolata
Gli scienziati non conoscono la funzione di una grande percentuale delle sequenze di basi su una molecola di DNA. Alcuni potrebbero essere solo spazzatura, mentre altri potrebbero interpretare ruoli non ancora compresi.