Velikost vzorca je majhen odstotek populacije, ki se uporablja za statistične analize. Na primer, ko ugotovimo, koliko ljudi bi na volitvah glasovalo za določeno osebo, ni možno (finančno ali logistično) povprašati vsako osebo v ZDA o njihovem glasovanju prednost. Namesto tega se vzame majhen vzorec prebivalstva. Velikost vzorca je lahko enaka nekaj sto ali nekaj tisoč. Vse je odvisno od tega, kakšne značilnosti želite, da ima ta vzorec populacije, in kako natančni želite, da so vaši rezultati.
Napaka pri nizkem vzorčenju
Vsakič, ko boste anketirali vzorec populacije (v nasprotju z vprašanji vseh), boste dobili nekaj statističnih podatkov, ki se nekoliko razlikujejo od "resničnih" statistik. To se imenuje vzorčna napaka in se pogosto izrazi kot odstotne točke. Anketa je na primer lahko plus ali minus "deset točk". Z drugimi besedami, če anketar ugotovi, da bo 55 odstotkov ljudi glasovalo za določen kandidat, plus ali minus deset točk, res pravijo, da bo za to glasovalo nekje med 45 in 65 odstotki kandidat. Dober vzorec bo imel majhno napako vzorčenja (točka ali dve).
Visoka stopnja zaupanja
Stopnja zaupanja temelji na teoriji, da bolj kot pogosto vzorčite populacijo, bolj so podatki podobni zvonovi. Stopnje zaupanja so izražene v odstotkih, na primer "90-odstotna stopnja zaupanja." Višja kot je stopnja zaupanja, bolj prepričan je raziskovalec da so njegovi podatki videti kot zvončna krivulja: zaželena je 99-odstotna stopnja zaupanja in verjetno bo imela boljše rezultate kot 90-odstotna (ali nižja) ravni.
Stopnja spremenljivosti
Stopnja variabilnosti se nanaša na raznolikost populacije. Na primer, anketa vseh političnih strank o zdravstvenem varstvu bo verjetno povzročila bolj razširjene razlike v odzivih kot preprosta anketa ene same stranke. Višji kot je navedeni delež, večja je stopnja variabilnosti, pri čemer je .5 najvišja (in morda najmanj zaželena) vrednost. Za manjše vzorce bi želeli videti nizko stopnjo variabilnosti (na primer .2).