In statistica, il campionamento casuale dei dati di una popolazione porta spesso alla produzione di una curva a campana con la media centrata sul picco della campana. Questa è nota come distribuzione normale. Il teorema del limite centrale afferma che all'aumentare del numero di campioni, la media misurata tende a distribuirsi normalmente intorno alla media della popolazione e la deviazione standard si restringe. Il teorema del limite centrale può essere utilizzato per stimare la probabilità di trovare un particolare valore all'interno di una popolazione.
Raccogliere campioni e quindi determinare la media. Ad esempio, supponiamo di voler calcolare la probabilità che un maschio negli Stati Uniti abbia un livello di colesterolo pari o superiore a 230 milligrammi per decilitro. Inizieremo raccogliendo campioni da 25 individui e misurando i loro livelli di colesterolo. Dopo aver raccolto i dati, calcolare la media del campione. La media si ottiene sommando ciascun valore misurato e dividendo per il numero totale di campioni. In questo esempio, supponiamo che la media sia 211 milligrammi per decilitro.
Calcola la deviazione standard, che è una misura dello "spread" dei dati. Questo può essere fatto in pochi semplici passaggi:
Disegna uno schizzo della distribuzione normale e dell'ombra nella probabilità appropriata. Seguendo l'esempio, vuoi conoscere la probabilità che un maschio abbia un livello di colesterolo di 230 milligrammi per decilitro o superiore. Per trovare la probabilità, scopri quanti errori standard distano dalla media 230 milligrammi per decilitro (valore Z):
Cerca la probabilità di ottenere un valore di 2,07 errori standard sopra la media. Se devi trovare la probabilità di trovare un valore entro 2,07 deviazioni standard della media, allora z è positivo. Se hai bisogno di trovare la probabilità di trovare un valore oltre 2,07 deviazioni standard della media, allora z è negativo.
Cerca il valore z su una tabella di probabilità normale standard. La prima colonna a sinistra mostra il numero intero e la prima cifra decimale del valore z. La riga in alto mostra la terza cifra decimale del valore z. Seguendo l'esempio, poiché il nostro valore z è -2,07, individuare prima -2,0 nella colonna di sinistra, quindi eseguire la scansione della riga superiore per la voce 0,07. Il punto in cui queste colonne e righe si intersecano è la probabilità. In questo caso, il valore letto dalla tabella è 0,0192 e quindi la probabilità di trovare un maschio con un livello di colesterolo di 230 milligrammi per decilitro o superiore è 1,92 percento.