В статистиката случайното вземане на проби от данни от популация често води до получаване на крива с форма на камбана със средната стойност, центрирана в пика на камбаната. Това е известно като нормално разпределение. Теоремата за централната граница гласи, че с увеличаване на броя на извадките измерената средна стойност обикновено се разпределя средно за популацията и стандартното отклонение става по-тясно. Теоремата за централната граница може да се използва за оценка на вероятността за намиране на определена стойност в една популация.
Вземете проби и след това определете средната стойност. Да предположим например, че искате да изчислите вероятността мъжът в САЩ да има ниво на холестерол от 230 милиграма на децилитър или повече. Ще започнем с събиране на проби от 25 индивида и измерване на нивата на холестерола им. След събиране на данните, изчислете средната стойност на пробата. Средната стойност се получава чрез сумиране на всяка измерена стойност и разделяне на общия брой проби. В този пример приемете, че средната стойност е 211 милиграма на децилитър.
Изчислете стандартното отклонение, което е мярка за „разпространението“ на данните. Това може да стане в няколко лесни стъпки:
Начертайте скица на нормалното разпределение и сянка с подходяща вероятност. Следвайки примера, искате да знаете вероятността мъжът да има ниво на холестерол от 230 милиграма на децилитър или повече. За да намерите вероятността, разберете колко стандартни грешки са далеч от средната стойност от 230 милиграма на децилитър (Z-стойност):
Потърсете вероятността да получите стойност 2,07 стандартни грешки над средната стойност. Ако трябва да намерите вероятността да намерите стойност в рамките на 2,07 стандартни отклонения на средната стойност, тогава z е положителна. Ако трябва да намерите вероятността да намерите стойност над 2.07 стандартни отклонения на средната стойност, z е отрицателна.
Потърсете z-стойността в стандартна нормална таблица на вероятностите. Първата колона отляво показва цялото число и първия десетичен знак на z-стойността. Редът отгоре показва третия десетичен знак на z-стойността. Следвайки примера, тъй като нашата z-стойност е -2.07, първо намерете -2.0 в лявата колона, след това сканирайте горния ред за записа 0.07. Точката, в която тези колони и редове се пресичат, е вероятността. В този случай стойността, отчетена от таблицата, е 0,0192 и по този начин вероятността да се намери мъж с ниво на холестерол от 230 милиграма на децилитър или повече е 1,92 процента.