Molti programmi universitari richiedono statistiche. Un concetto chiave presentato in una tipica classe di statistica è la distribuzione normale dei dati o una curva a campana. Comprendere come interpretare un insieme di dati che rientra in una distribuzione naturale rende possibile la comprensione degli studi scientifici. Acquisire una buona comprensione della curva a campana, della media, delle deviazioni standard e della loro relazione con i percentili per acquisire dimestichezza con il linguaggio della ricerca scientifica.
Distribuzione normale e curva a campana
Quando molti tipi di dati naturali come altezza, quozienti di intelligenza e pressione sanguigna vengono tracciati su un istogramma, dove i punteggi sono sull'asse orizzontale e le occorrenze o il numero di punteggi sono sull'asse verticale, i dati cadono in uno schema a campana chiamato curva a campana. Questo modello, noto come distribuzione normale, si presta all'analisi statistica.
La media e la mediana
La media media di tutti i punteggi cadrà approssimativamente al centro della curva a campana. La media rappresenta il 50° percentile, in cui metà di tutti i punteggi è superiore a tale misura e metà è inferiore. Nei dati normalmente distribuiti, il punteggio mediano cadrà anche al centro della curva a campana, che rappresenta il maggior numero di occorrenze.
Deviazioni standard e varianza
Quanto è lontana una misura dalla media? In insiemi di dati normalmente distribuiti, una misura può essere descritta come un certo numero di deviazioni standard dalla media. Una deviazione standard è una misura della varianza, o quanto dispersi, o sparsi, i dati sono dalla media. Se le misure hanno molta varianza, la curva a campana viene allargata; se hanno poca varianza, la curva a campana è stretta. Maggiore è la deviazione standard del punteggio, minore è la probabilità che il punteggio si verifichi in natura.
I percentili e la regola empirica
Quando si osserva una curva a campana, il 68% delle misure si trova all'interno di una deviazione standard della media. Il 95% della distribuzione si trova all'interno di due deviazioni standard della media. Un enorme 99,7% delle misure rientra in tre deviazioni standard da esso. Queste percentuali, chiamate la regola empirica, sono il fondamento dell'analisi statistica dei fenomeni naturali. Se un ricercatore medico, ad esempio, scopre che un gruppo che ha preso un determinato farmaco per controllare il colesterolo ora ha misure di colesterolo due deviazioni standard dalla media, sarebbe improbabile che lo faccia accadere per caso.