Ve statistikách náhodné vzorkování dat z populace často vede k vytvoření křivky ve tvaru zvonu se střední hodnotou soustředěnou na špičce zvonu. Toto se nazývá normální rozdělení. Centrální limitní věta uvádí, že s rostoucím počtem vzorků má měřený průměr tendenci být normálně distribuován kolem populačního průměru a směrodatná odchylka se zužuje. Centrální limitní teorém lze použít k odhadu pravděpodobnosti nalezení konkrétní hodnoty v populaci.
Sbírejte vzorky a poté určete průměr. Předpokládejme například, že chcete vypočítat pravděpodobnost, že muž ve Spojených státech má hladinu cholesterolu 230 miligramů na deciliter nebo vyšší. Začali bychom sbíráním vzorků od 25 jedinců a měřením jejich hladin cholesterolu. Po shromáždění údajů vypočítejte průměr vzorku. Průměr se získá sečtením každé naměřené hodnoty a vydělením celkovým počtem vzorků. V tomto příkladu předpokládejme, že průměr je 211 miligramů na deciliter.
Vypočítejte směrodatnou odchylku, která je měřítkem „rozprostření“ dat. To lze provést v několika snadných krocích:
Nakreslete náčrt normálního rozdělení a stínu s příslušnou pravděpodobností. Podle příkladu chcete znát pravděpodobnost, že muž má hladinu cholesterolu 230 miligramů na deciliter nebo vyšší. Chcete-li zjistit pravděpodobnost, zjistěte, kolik standardních chyb od průměrné hodnoty 230 miligramů na deciliter je (hodnota Z):
Vyhledejte pravděpodobnost získání standardní chyby 2,07 nad průměrem. Pokud potřebujete zjistit pravděpodobnost nalezení hodnoty v rámci 2,07 směrodatných odchylek od průměru, pak je z kladné. Pokud potřebujete zjistit pravděpodobnost nalezení hodnoty nad 2,07 směrodatných odchylek průměru, pak z je záporné.
Vyhledejte hodnotu z na standardní normální pravděpodobnostní tabulce. První sloupec na levé straně zobrazuje celé číslo a první desetinné místo hodnoty z. Řádek v horní části zobrazuje třetí desetinné místo hodnoty z. Podle příkladu, protože naše z-hodnota je -2,07, nejprve vyhledejte -2,0 v levém sloupci a poté v horním řádku vyhledejte položku 0,07. Bod, ve kterém se tyto sloupce a řádky protínají, je pravděpodobnost. V tomto případě je hodnota odečtená z tabulky 0,0192, a tedy pravděpodobnost nalezení muže, který má hladinu cholesterolu 230 miligramů na deciliter nebo vyšší, je 1,92 procenta.