W statystyce losowe próbkowanie danych z populacji często prowadzi do wytworzenia krzywej w kształcie dzwonu ze średnią wyśrodkowaną na szczycie dzwonu. Nazywa się to rozkładem normalnym. Centralne twierdzenie graniczne stwierdza, że wraz ze wzrostem liczby próbek zmierzona średnia ma zwykle rozkład normalny wokół średniej populacji, a odchylenie standardowe staje się węższe. Centralne twierdzenie graniczne można wykorzystać do oszacowania prawdopodobieństwa znalezienia określonej wartości w populacji.
Pobrać próbki, a następnie określić średnią. Załóżmy na przykład, że chcesz obliczyć prawdopodobieństwo, że mężczyzna w Stanach Zjednoczonych ma poziom cholesterolu wynoszący 230 miligramów na decylitr lub wyższy. Zaczęlibyśmy od pobrania próbek od 25 osób i zmierzenia ich poziomu cholesterolu. Po zebraniu danych oblicz średnią próbki. Średnią otrzymuje się sumując każdą zmierzoną wartość i dzieląc ją przez całkowitą liczbę próbek. W tym przykładzie załóżmy, że średnia wynosi 211 miligramów na decylitr.
Oblicz odchylenie standardowe, które jest miarą „rozrzutu” danych. Można to zrobić w kilku prostych krokach:
Narysuj szkic rozkładu normalnego i zaciemnij z odpowiednim prawdopodobieństwem. Idąc za przykładem, chcesz poznać prawdopodobieństwo, że samiec ma poziom cholesterolu wynoszący 230 miligramów na decylitr lub wyższy. Aby znaleźć prawdopodobieństwo, sprawdź, ile błędów standardowych dzieli od średniej 230 miligramów na decylitr (wartość Z):
Sprawdź prawdopodobieństwo uzyskania wartości błędu standardowego 2,07 powyżej średniej. Jeśli chcesz znaleźć prawdopodobieństwo znalezienia wartości w granicach 2,07 odchylenia standardowego od średniej, to z jest dodatnie. Jeśli chcesz znaleźć prawdopodobieństwo znalezienia wartości powyżej 2,07 odchylenia standardowego średniej, to z jest ujemne.
Wyszukaj wartość z w standardowej tabeli prawdopodobieństwa normalnego. Pierwsza kolumna po lewej stronie pokazuje liczbę całkowitą i pierwsze miejsce po przecinku wartości z. Wiersz u góry pokazuje trzecie miejsce po przecinku wartości z. Idąc za przykładem, ponieważ nasza wartość z wynosi -2,07, najpierw zlokalizuj -2,0 w lewej kolumnie, a następnie przeskanuj górny wiersz w poszukiwaniu wpisu 0,07. Punkt, w którym te kolumny i wiersze przecinają się, to prawdopodobieństwo. W tym przypadku wartość odczytana z tabeli wynosi 0,0192, a zatem prawdopodobieństwo znalezienia mężczyzny z poziomem cholesterolu 230 miligramów na decylitr lub wyższym wynosi 1,92 procent.