Mange universitetsprogrammer kræver statistik. Et nøglebegreb præsenteret i en typisk statistikklasse er den normale fordeling af data eller en bjælkekurve. At forstå, hvordan man fortolker et datasæt, der falder i en naturlig fordeling, gør det muligt at forstå videnskabelige studier. Opnå en god forståelse af klokkekurven, middelværdien, standardafvigelser og deres forhold til percentiler for at blive fortrolige på det videnskabelige forskningssprog.
Normalfordeling og klokkekurven
Når mange typer af naturligt forekommende data såsom højde, intelligenskvotienter og blodtryk afbildes på et histogram, hvor scorerne er på den vandrette akse, og forekomsterne eller antallet af scoringer er på den lodrette akse, falder dataene i et klokkeformet mønster kaldet en klokkekurve. Dette mønster, kendt som en normalfordeling, egner sig til statistisk analyse.
Middelværdien og medianen
Det gennemsnitlige gennemsnit af alle scoringer vil falde ved den omtrentlige midte af klokkekurven. Gennemsnittet repræsenterer den 50. percentil, hvor halvdelen af alle scoringer er over dette mål, og halvdelen er under. I normalt distribuerede data vil median score også falde i midten af klokkekurven, hvilket repræsenterer de fleste forekomster.
Standardafvigelser og variation
Hvor langt væk fra middelværdien er et mål? I normalt distribuerede datasæt kan en måling beskrives som værende et bestemt antal standardafvigelser væk fra gennemsnittet. En standardafvigelse er et variansmål, eller hvor spredt eller spredt dataene er fra middelværdien. Hvis målinger har stor variation, er bjælkekurven spredt; hvis de har ringe afvigelse, er klokkekurven smal. Jo flere standardafvigelser væk scoren er, desto mindre sandsynligt er scoren at forekomme i naturen.
Percentiler og Empircal-reglen
Når man ser på en klokkekurve, ligger 68% af målene inden for en standardafvigelse af middelværdien. 95% af fordelingen ligger inden for to standardafvigelser af middelværdien. Hele 99,7% af foranstaltningerne falder inden for tre standardafvigelser. Disse procenter, kaldet den empiriske regel, er grundlaget for statistisk analyse af naturligt forekommende fænomener. Hvis en medicinsk forsker for eksempel finder ud af, at en gruppe, der tog en bestemt medicin til kontrol kolesterol nu har målinger af kolesterol to standardafvigelser fra gennemsnittet, det ville sandsynligvis ikke være forekomme tilfældigt.