Evnen til å beregne gjennomsnittsverdien eller middelverdien til en gruppe tall er viktig i alle aspekter av livet. Hvis du er professor som tildeler bokstavkarakterer til eksamenspoeng og tradisjonelt gir karakteren B- til en midt i pakken, så trenger du helt klart å vite hvordan midten av pakken ser ut numerisk. Du trenger også en måte å identifisere poeng som avvikere, slik at du kan bestemme når noen fortjener A eller A + (utenom perfekte poeng, tydeligvis), samt hva som fortjener en ikke karakter.
Av denne og relaterte årsaker inkluderer fullstendige data om gjennomsnitt informasjon om hvor tett gruppert rundt gjennomsnittspoengene generelt er. Denne informasjonen formidles ved hjelp av standardavvik og relatert den forskjell av et statistisk utvalg.
Målinger av variabilitet
Du har nesten helt sikkert hørt eller sett begrepet "gjennomsnitt" brukt i referanse til et sett med tall eller datapunkter, og du har sannsynligvis en ide om hva det oversetter til i hverdagsspråket. Hvis du for eksempel leser at gjennomsnittshøyden til en amerikansk kvinne er omtrent 5 '4 ", konkluderer du umiddelbart med det "gjennomsnitt" betyr "typisk", og at omtrent halvparten av kvinnene i USA er høyere enn dette mens omtrent halvparten er det kortere.
Matematisk, gjennomsnitt og mener er nøyaktig det samme: Du legger til alle verdiene i et sett og deler med antall elementer i settet. For eksempel, hvis en gruppe på 25 scorer på et 10-spørsmålstest fra 3 til 10 og legger opp til 196, er gjennomsnittlig (gjennomsnitt) poengsum 196/25, eller 7,84.
Medianen er midtpunktverdien i et sett, tallet som halvparten av verdiene ligger over og halvparten av verdiene ligger under. Det er vanligvis nær gjennomsnittet (gjennomsnittet), men er ikke det samme.
Variansformel
Hvis du øyeepler et sett med 25 poeng som de ovenfor og nesten ikke ser noe annet enn verdiene 7, 8 og 9, er det intuitivt fornuftig at gjennomsnittet skal være rundt 8. Men hva om du nesten ikke ser score 6 og 10? Eller fem poeng på 0 og 20 poeng på 9 eller 10? Alle disse kan produsere det samme gjennomsnittet.
Variasjon er et mål på hvor bredt punktene i et datasett er spredt om gjennomsnittet. For å beregne avvik for hånd tar du den aritmetiske forskjellen mellom hvert av datapunktene og gjennomsnittet, kvadrat dem, legg til summen av kvadratene og del resultatet med ett mindre enn antall datapunkter i prøve. Et eksempel på dette er gitt senere. Du kan også bruke programmer som Excel eller nettsteder som Rapid Tables (se Ressurser for flere nettsteder).
Avviket er betegnet med σ2, en gresk "sigma" med en eksponent på 2.
Standardavvik
De standardavvik av et utvalg er ganske enkelt kvadratroten til variansen. Årsaken til at firkanter brukes når du beregner varians, er at hvis du bare legger sammen de individuelle forskjellene mellom gjennomsnittet og hvert individuelt datapunkt, er summen alltid null fordi noen av disse forskjellene er positive og noen er negative, og de avbryter hverandre ute. Kvadrering av hvert semester eliminerer denne fallgruven.
Eksempel på avvik og standardavvik
Anta at du får de 10 datapunktene:
4, 7, 10, 5, 7, 6, 9, 8, 5, 9
Finn gjennomsnittet, variansen og standardavviket.
Først legger du til de 10 verdiene sammen og deler med 10 for å få gjennomsnittet (gjennomsnittet):
70/10 = 7.0
For å få variansen, kvadrat forskjellen mellom hvert datapunkt og gjennomsnittet, legg disse sammen og del resultatet med (10 - 1), eller 9:
- 7 - 4 = 3; 32 = 9
- 7 - 7 = 0; 02 = 0
- 7 - 10 = -3; (-3)2 = 9.. .
9 + 0 + 9 +... + 4 = 36
σ2= 36/9 = 4.0
Standardavviket σ er bare kvadratroten på 4.0, eller 2.0.