Размерът на извадката е малък процент от популацията, който се използва за статистически анализ. Например, когато разберем колко души биха гласували за определен човек на избори, това не е така възможно (финансово или логистично) да попитате всеки човек в Съединените щати за неговото гласуване предпочитание. Вместо това се взема малка извадка от населението. Размерът на извадката може да бъде равен на няколкостотин или може да бъде равен на няколко хиляди. Всичко зависи от това какви характеристики искате да има тази извадка от популацията и колко точни искате да бъдат вашите резултати.
Ниска грешка при вземане на проби
Всеки път, когато анкетирате извадка от популация (вместо да питате всички), ще получите някои статистически данни, които са малко по-различни от "истинските" статистически данни. Това се нарича грешка в извадката и често се изразява като процентни точки. Например, анкета може да бъде плюс или минус „десет точки“. С други думи, ако социолог установи, че 55 процента от хората ще гласуват за определен кандидат, плюс или минус десет точки, те наистина казват, че някъде между 45 и 65 процента ще гласуват за това кандидат. Една добра извадка ще има малка грешка в извадката (точка или две).
Високо ниво на доверие
Нивото на доверие се основава на теорията, че колкото по-често вземате проби от популация, толкова повече данните наподобяват крива на камбана. Нивата на доверие се изразяват като процент, като например „ниво на доверие от 90 процента“. Колкото по-високо е нивото на доверие, толкова по-сигурен е изследователят че неговите данни изглеждат като крива на камбана: желателно е 99% ниво на доверие и вероятно ще има по-добри резултати от 90% (или по-ниско) доверие ниво.
Степен на променливост
Степента на изменчивост се отнася до това колко разнообразно е населението. Например, анкета на всички политически партии за здравеопазването вероятно ще доведе до по-широко разпространени вариации в отговорите, отколкото обикновена анкета на една партия. Колкото по-висока е декларираната пропорция, толкова по-голямо е нивото на променливост, като .5 е най-високата (и евентуално най-малко желаната) стойност. За по-малки проби бихте искали да видите ниска степен на променливост (например .2).