Mange høyskoleprogrammer krever statistikk. Et sentralt konsept presentert i en typisk statistikklasse er normalfordeling av data eller en bjellekurve. Å forstå hvordan man tolker et datasett som faller i en naturlig distribusjon, gjør det mulig å forstå vitenskapelige studier. Få god forståelse av bjelkekurven, gjennomsnittet, standardavvik og deres forhold til persentiler for å bli kjent med språket for vitenskapelig forskning.
Normalfordeling og bjellekurven
Når mange typer naturlig forekommende data som høyde, intelligenskvotienter og blodtrykk er plottet på et histogram, der poengene er på den horisontale aksen og forekomster eller antall poeng er på den vertikale aksen, faller dataene i et klokkeformet mønster som kalles en bjellekurve. Dette mønsteret, kjent som en normalfordeling, egner seg til statistisk analyse.
Gjennomsnittet og medianen
Gjennomsnittet av alle poengene vil falle omtrent i midten av bjellekurven. Gjennomsnittet representerer den 50. persentilen, der halvparten av alle poeng er over det målet, og halvparten er under. I normalt distribuerte data vil medianpoengsummen også falle i midten av bjelkekurven, noe som representerer de fleste forekomster.
Standardavvik og avvik
Hvor langt unna gjennomsnittet er et mål? I normalt distribuerte datasett kan et mål beskrives som et visst antall standardavvik unna gjennomsnittet. Et standardavvik er et mål på varians, eller hvor spredt, eller spredt, dataene er fra gjennomsnittet. Hvis tiltak har stor variasjon, er bjelkekurven spredt; hvis de har liten avvik, er bjellekurven smal. Jo flere standardavvik bort poengsummen er, desto mindre sannsynlig er poengsummen i naturen.
Prosentiler og Empircal-regelen
Når vi ser på en bjellekurve, ligger 68% av tiltakene innenfor ett standardavvik fra gjennomsnittet. 95% av fordelingen ligger innenfor to standardavvik fra gjennomsnittet. Hele 99,7% av tiltakene faller innenfor tre standardavvik. Disse prosentandelene, betegnet som den empiriske regelen, er grunnlaget for statistisk analyse av naturlig forekommende fenomener. Hvis en medisinsk forsker for eksempel finner ut at en gruppe som tok en bestemt medisin for å kontrollere kolesterol nå har mål på kolesterol to standardavvik fra gjennomsnittet, ville det være lite sannsynlig oppstå ved en tilfeldighet.