統計では、母集団からのデータのランダムサンプリングにより、平均がベルのピークを中心とするベル型の曲線が生成されることがよくあります。 これは正規分布として知られています。 中心極限定理は、標本数が増えると、測定された平均は母平均の周りに正規分布する傾向があり、標準偏差は狭くなると述べています。 中心極限定理は、母集団内で特定の値を見つける確率を推定するために使用できます。
サンプルを収集し、平均を決定します。 たとえば、米国の男性のコレステロール値が1デシリットルあたり230ミリグラム以上である確率を計算するとします。 まず、25人の個人からサンプルを収集し、コレステロール値を測定します。 データを収集した後、サンプルの平均を計算します。 平均値は、各測定値を合計し、サンプルの総数で割ることによって得られます。 この例では、平均が1デシリットルあたり211ミリグラムであると想定しています。
データの「広がり」の尺度である標準偏差を計算します。 これは、いくつかの簡単な手順で実行できます。
適切な確率で正規分布と陰影のスケッチを描きます。 例に従って、男性のコレステロール値が1デシリットルあたり230ミリグラム以上である確率を知りたいとします。 確率を見つけるには、1デシリットルあたり平均230ミリグラムから離れた標準誤差がいくつあるかを調べます(Z値)。
平均を超える2.07標準誤差の値を取得する確率を調べます。 平均の2.07標準偏差内の値を見つける確率を見つける必要がある場合、zは正です。 平均の2.07標準偏差を超える値を見つける確率を見つける必要がある場合、zは負です。
標準正規確率表でz値を調べます。 左側の最初の列は、z値の整数と小数点以下第1位を示しています。 上部の行は、z値の小数点以下第3位を示しています。 例に従って、z値は-2.07であるため、最初に左側の列で-2.0を見つけてから、一番上の行をスキャンして0.07エントリを探します。 これらの列と行が交差するポイントが確率です。 この場合、表から読み取られた値は0.0192であるため、コレステロール値が230ミリグラム/デシリットル以上の男性を見つける確率は1.92パーセントです。