Genom ludzki to kompletny katalog informacji genetycznej niesionej przez ludzi. Human Genome Project rozpoczął proces systematycznej identyfikacji i mapowania całej struktury ludzkiego DNA w 1990 roku. Pierwszy kompletny ludzki genom został opublikowany w 2003 roku, a prace są kontynuowane. W ramach projektu zidentyfikowano ponad 20 000 kodujących białka genów rozproszonych wśród 23 par chromosomów występujących u ludzi.
Jednak te geny stanowią tylko około 1,5 procent ludzkiego genomu. Zidentyfikowano kilka typów sekwencji DNA, ale wiele pytań pozostaje.
Geny kodujące białka
Geny kodujące białka to sekwencje DNA używane przez komórki do syntezy białek. DNA składa się z długiego szkieletu cukrowo-fosforanowego, z którego zwisają cztery mniejsze cząsteczki zwane zasadami. Cztery zasady są skrócone jako A, C, T i G.
Sekwencja tych czterech zasad wzdłuż części kodujących białko szkieletu DNA odpowiada sekwencjom aminokwasów, cegiełek budulcowych białek. Geny kodujące białka określają białka, które określają fizyczną strukturę człowieka i kontrolują chemię naszego ciała.
Regulacyjne sekwencje DNA
Różne komórki potrzebują różnych białek w różnym czasie. Na przykład białka potrzebne komórce mózgowej mogą być bardzo różne od tych, których potrzebuje komórka wątroby. Dlatego komórka musi selektywnie wybierać białka, które musi wyprodukować.
Regulacyjne sekwencje DNA łączą się z białkami i innymi czynnikami, aby kontrolować, które geny są aktywne w danym momencie. Służą również jako markery identyfikujące początek i koniec genów. Poprzez procesy biochemiczne i mechanizmy sprzężenia zwrotnego regulujące sekwencje DNA kontrolują ekspresję genów.
Geny dla niekodującego RNA
DNA nie wytwarza bezpośrednio białka. RNA, pokrewna cząsteczka, służy jako pośrednik. Geny DNA są najpierw transkrybowane do informacyjnego RNA, które następnie przenosi kod genetyczny do miejsc fabryki białek w innych częściach komórki.
DNA może również dokonywać transkrypcji niekodujących białek cząsteczek RNA, które komórka wykorzystuje do różnych funkcji. Na przykład DNA jest matrycą dla ważnego typu niekodującego RNA używanego do budowy fabryk białek znajdujących się w całej komórce.
Introny
Kiedy gen jest transkrybowany do RNA, części RNA mogą wymagać usunięcia, ponieważ zawierają niepotrzebne lub mylące informacje. Sekwencje DNA, które kodują ten niepotrzebny RNA, nazywane są intronami. Gdyby RNA utworzone przez introny w genach kodujących białka nie zostały oddzielone, powstałe białko byłoby zniekształcone lub bezużyteczne.
Proces splicingu RNA jest dość niezwykły – biochemia komórki musi wiedzieć o intronach istnienia, precyzyjnie zlokalizuj jego sekwencję na nici RNA, a następnie wytnij ją dokładnie po prawej stronie miejsca.
Rozległe pustkowia
Naukowcy nie znają funkcji dużego odsetka sekwencji zasad w cząsteczce DNA. Niektóre mogą być po prostu śmieciami, podczas gdy inne mogą odgrywać role, które jeszcze nie zostały zrozumiane.