Evnen til at beregne gennemsnittet eller middelværdien af en gruppe af tal er vigtig i alle aspekter af livet. Hvis du er professor, der tildeler bogstavkarakterer til eksamensresultater og traditionelt giver karakteren B- til en midt-i-pakke-score, så skal du tydeligt vide, hvordan midten af pakken ser ud numerisk. Du har også brug for en måde at identificere scores som outliers, så du kan bestemme, hvornår nogen fortjener en A eller A + (uden for perfekte scores, naturligvis) såvel som hvad der fortjener en manglende karakter.
Af denne og relaterede årsager inkluderer komplette data om gennemsnit oplysninger om, hvor tæt grupperet omkring gennemsnittet score scorerne generelt er. Disse oplysninger formidles vha standardafvigelse og beslægtet varians af en statistisk stikprøve.
Mål for variation
Du har næsten helt sikkert hørt eller set udtrykket "gennemsnit" brugt med henvisning til et sæt tal eller datapunkter, og du har sandsynligvis en idé om, hvad det oversætter til i det daglige sprog. For eksempel, hvis du læser, at en amerikansk kvindes gennemsnitlige højde er ca. 5 '4 ", konkluderer du straks det "gennemsnit" betyder "typisk", og at omkring halvdelen af kvinderne i USA er højere end dette, mens omkring halvdelen er det kortere.
Matematisk, gennemsnit og betyde er nøjagtig den samme ting: Du tilføjer alle værdierne i et sæt og dividerer med antallet af elementer i sættet. For eksempel, hvis en gruppe på 25 scorer på et test med 10 spørgsmål fra 3 til 10 og tilsammen op til 196, er den gennemsnitlige (gennemsnitlige) score 196/25 eller 7,84.
Medianen er midtpunktværdien i et sæt, antallet som halvdelen af værdierne ligger over og halvdelen af værdierne ligger under. Det er normalt tæt på gennemsnittet (gennemsnit), men det er ikke det samme.
Variansformel
Hvis du øjer et sæt på 25 scoringer som dem ovenfor og næsten ikke ser andet end værdier på 7, 8 og 9, giver det intuitiv mening, at gennemsnittet skal være omkring 8. Men hvad hvis du næsten ikke ser andet end score på 6 og 10? Eller fem scores på 0 og 20 scores på 9 eller 10? Alle disse kan producere det samme gennemsnit.
Varians er et mål for, hvor bredt punkterne i et datasæt er spredt omkring gennemsnittet. For at beregne varians i hånden tager du den aritmetiske forskel mellem hvert af datapunkterne og gennemsnittet, kvadrat dem, tilføj summen af kvadraterne og divider resultatet med et mindre end antallet af datapunkter i prøve. Et eksempel på dette gives senere. Du kan også bruge programmer som Excel eller websteder som Rapid Tables (se Ressourcer for yderligere websteder).
Variansen er betegnet med σ2, en græsk "sigma" med en eksponent på 2.
Standardafvigelse
Det standardafvigelse af en prøve er simpelthen kvadratroden af variansen. Årsagen til, at firkanter bruges, når der beregnes varians, er, at hvis du blot tilføjer de individuelle forskelle mellem gennemsnittet og hver individuelt datapunkt, er summen altid nul, fordi nogle af disse forskelle er positive, og nogle er negative, og de annullerer hinanden ud. Kvadratering af hver periode eliminerer denne faldgrube.
Eksempel på variation og standardafvigelsesproblem
Antag, at du får de 10 datapunkter:
4, 7, 10, 5, 7, 6, 9, 8, 5, 9
Find gennemsnittet, variansen og standardafvigelsen.
Først skal du tilføje de 10 værdier sammen og dele med 10 for at få gennemsnittet (middelværdien):
70/10 = 7.0
For at få variansen kvadrerer du forskellen mellem hvert datapunkt og gennemsnittet, tilføjer disse sammen og deler resultatet med (10 - 1) eller 9:
- 7 - 4 = 3; 32 = 9
- 7 - 7 = 0; 02 = 0
- 7 - 10 = -3; (-3)2 = 9.. .
9 + 0 + 9 +... + 4 = 36
σ2= 36/9 = 4.0
Standardafvigelsen σ er bare kvadratroden på 4.0 eller 2.0.