DNA er et langt polymermolekyl. En polymer er et stort molekyl bygget fra mange identiske eller nesten identiske deler. Når det gjelder DNA, er de nesten identiske delene molekyler som kalles kjernebaser: adenin, tymin, cytosin og guanin. De fire basene forkortes ofte A, T, C og G. Basenes rekkefølge - den spesifikke rekkefølgen til A, T, C og G - inneholder all informasjonen som trengs for å bygge proteiner.
DNA er et relativt enkelt molekyl sammenlignet med proteinene i cellen. Så et spørsmål forskerne hadde var hvordan et enkelt molekyl kunne kontrollere konstruksjonen av de mer komplekse. Et eksempel på forvirring: DNA er bygget fra stort sett bare fire komponenter, kjernebasene, mens proteiner er bygget av 20 forskjellige aminosyrer. Svaret var i rekkefølgen av basene.
Hvis hver kjernefysisk base tilsvarte en aminosyre, kunne proteiner bare ha fire forskjellige aminosyrer. Hvis det tok to baser å tilsvare aminosyrene - AA, AT, AG og så videre - kunne det bare være maksimalt 16 forskjellige aminosyrer. Svaret er at det tar tre baser sammen for å kontrollere samlingen av en aminosyre på et protein. De tre bokstavskodene kalles "trillinger" eller "kodoner".