Si at du vet at gjennomsnittshøyden til en amerikansk kvinne er nær 5 fot (4 tommer) (ca. 1,63 m). Si at du også ble fortalt at et auditorium der 500 voksne kvinner står, er et perfekt representativt utvalg av den amerikanske befolkningen. Det vil si at du ganske kan forvente at gjennomsnittshøyden til kvinnene i auditoriet også vil være 5 '4 ".
Hvis du tilfeldigvis valgte tre personer for å gå ut av rommet, forventer du at gjennomsnittet eller gjennomsnittet av høydene deres blir nøyaktig 5 '4 "? Hvorfor eller hvorfor ikke? Hva om du valgte 10 personer i stedet? Eller 100? Videre si at du gjentok eksperimentet med å måle høydene til tre tilfeldig utvalgte kvinner i rommet om og om igjen, og deretter gjennomsnittet disse gjennomsnitt?
Over tid kan du forvente gjennomsnittet av disse gjennomsnittene, som hver kalles x-bar (x̄) eller prøve middel, for å nærme seg befolkningens gjennomsnitt på 5 '4 ". Og hvis du brukte større prøver, forventer du at denne konvergensen av prøvetakingsmidlene og den sanne (populasjonen) betyr å skje raskere. Men hvorfor?
Befolkningsstatistikk
Svarene på spørsmålene ovenfor ligger i det statistiske området samplingsfordelinger. Men først er noen terminologi og definisjoner i orden.
Befolkningsgjennomsnittet er en akseptert, empirisk bestemt verdi som gjelder den største mulige gruppen personer du studerer. Dermed hvis auditoriet ditt inneholder 500 amerikanske kvinner, er hele settet med amerikanske kvinner den større befolkningen som er underforstått.
s representerer et lignende konsept: En kjent populasjon proporsjon, for eksempel "andelen hunder over hele verden som kan løpe over 15 miles i timen er 0,40 (40 prosent)." p̂, kalt "p-hat", er den gjennomsnittlige andelen som er funnet etter å ha tatt et antall prøver av samme størrelse (f.eks. 10 hunder) fra den store befolkningen.
For eksempel kan en gruppe på 10 tilfeldig utvalgte hunder ha en gjennomsnittlig hastighet på 17,8 MPH, den neste 14,3 MPH, den neste 12,8 MPH og så videre til du har analysert så mange prøver du vil.
Prøvetakingsstatistikk
Samplingsfordelinger lar deg bestemme om bassenget du tar prøver fra, virkelig er representativ for den større befolkningen. Dette er ifølge, ifølge Central Limit Theorem, som antall x-bar (x̄) stiger, en graf over gjennomsnittet og fordelingen deres vil ligne den for den sanne befolkningens gjennomsnitt. Det vil si at det vil være en normal (klokkeformet) fordeling.
Tilbake til kvinnene i auditoriet: Over tid kan du forvente gjennomsnittet av disse gjennomsnittene, kalt x-bar (x̄) eller prøven betyr, å nærme seg populasjonsgjennomsnittet på 5 '4 "uansett hvor mange datapunkter (n) du inkluderer Hver x-bar. Og hvis du bruker større prøver, for eksempel 100 personer eller hunder om gangen i stedet for 10, forventer du begge begge individuelle x̄ vil være nærmere det sanne gjennomsnittet, og at færre forekomster av x̄ må beregnes i gjennomsnitt for å komme nærmere dette ekte middel.
Hvis du for eksempel valgte tre kvinner, vil du ikke bli overrasket om gjennomsnittshøyden deres var 5 '9 "eller 5' 1". fordi en enkelt veldig høy eller veldig kort "outlier" kan kaste et gjennomsnitt mye når antall datapunkter er liten.
Men hvis du kjørte gjentatte studier på 100 kvinner og så x-bar-verdier på 5 '8.2 ", 5' 7.3", og så videre, ville du ha grunn til å konkluderer med at populasjonsutvalget på 500 i auditoriet faktisk ikke var et tilfeldig valgt utvalg av amerikanske kvinner.
X-Bar Kalkulator
Du kan raskt finne verdien av x-bar for ethvert utvalg ved å referere til en side som den i Resources. For å oppsummere disse verdiene for å få en samplingsfordeling, kan du bruke regnearkprogrammer som Microsoft Excel eller Google Sheets som har forskjellige forhåndspakkede statistiske verktøy for bruk som disse.