DNA er et langt polymermolekyle. En polymer er et stort molekyle bygget af mange identiske eller næsten identiske dele. I tilfælde af DNA er de næsten identiske dele molekyler kaldet nukleare baser: adenin, thymin, cytosin og guanin. De fire baser forkortes ofte A, T, C og G. Basernes rækkefølge - den specifikke rækkefølge af A, T, C og G - indeholder al den information, der er nødvendig for at opbygge proteiner.
DNA er et relativt simpelt molekyle sammenlignet med proteinerne i cellen. Så et spørgsmål, som forskere havde, var, hvordan et simpelt molekyle kunne kontrollere opbygningen af de mere komplekse. Et eksempel på forvirring: DNA er bygget fra stort set kun fire komponenter, de nukleare baser, mens proteiner er bygget af 20 forskellige aminosyrer. Svaret var i rækkefølgen af baserne.
Hvis hver nuklear base svarede til en aminosyre, kunne proteiner kun have fire forskellige aminosyrer. Hvis det tog to baser at svare til aminosyrerne - AA, AT, AG og så videre - kunne der kun være maksimalt 16 forskellige aminosyrer. Svaret er, at det tager tre baser sammen at kontrollere samlingen af en aminosyre på et protein. De tre bogstavkoder kaldes "tripletter" eller "kodoner".