Sano, että tiedät, että amerikkalaisen naisen keskimääräinen korkeus on lähellä noin 1,63 m. Oletetaan, että sinulle kerrottiin myös, että auditorio, jossa seisoo 500 aikuista naista, on täysin edustava näyte Amerikan väestöstä. Toisin sanoen voit melko odottaa, että naisten keskimääräinen korkeus auditoriossa on myös 5 '4 ".
Jos valitsisit satunnaisesti kolme ihmistä poistuttaaksesi huoneesta, odotatko heidän keskimääräisen tai keskimääräisen korkeuden olevan täsmälleen 5 '4 "? Miksi tai miksi ei? Entä jos valitsisit 10 henkilöä sen sijaan? Tai 100? Lisäksi sanokaa, että toistat kokeen, jossa mitattiin kolmen satunnaisesti valitun naisen korkeudet huoneessa jatkuvasti ja sitten keskiarvo nämä keskiarvot?
Ajan myötä saatat odottaa näiden keskiarvojen keskiarvoa, joista kutakin kutsutaan x-palkki (x̄) tai näytekeskiarvo, lähestyä väestökeskiarvoa 5 '4 ". Ja jos käytit suurempia otoksia, voit odottaa, että tämä näytteenottovälineiden ja todellisten (populaatio) keinojen lähentyminen tapahtuu nopeammin. Mutta miksi?
Väestötilastot
Vastaukset yllä oleviin kysymyksiin löytyvät näytteenottojakaumat. Mutta ensin jotkut terminologiat ja määritelmät ovat kunnossa.
Populaatiokeskiarvo on hyväksytty, empiirisesti määritetty arvo, joka koskee suurinta mahdollista tutkittavien henkilöiden ryhmää. Jos auditoriossasi on 500 amerikkalaista naista, koko amerikkalaisten naisten joukko on sitä suurempi väestö.
s edustaa samanlaista käsitettä: tunnettu väestö osuus, kuten "koirien osuus maailmanlaajuisesti yli 15 mailia tunnissa on 0,40 (40 prosenttia)". p̂, jota kutsutaan "p-hatuksi", on keskimääräinen osuus, joka havaitaan ottamalla useita samankokoisia näytteitä (esim. 10 koiraa) suuresta populaatiosta.
Esimerkiksi yhden 10 satunnaisesti valitun koiran ryhmän keskimääräinen nopeus voi olla 17,8 MPH, seuraava 14,3 MPH, seuraava 12,8 MPH ja niin edelleen, kunnes olet analysoinut niin monta näytettä kuin haluat.
Näytteenottotilastot
Näytteenottojakaumien avulla voit määrittää, edustaako pooli, josta otat näytteitä, todella suurempaa väestöä. Tämä johtuu siitä, että Keskirajan lause, lukumääränä x-palkki (x̄) nousee, kaavio niiden keskiarvosta ja jakautumisesta muistuttaa todellisen väestö keskiarvoa Eli se on normaali (kellon muotoinen) jakauma.
Takaisin auditoriossa oleviin naisiin: Ajan myötä saatat odottaa näiden keskiarvojen keskiarvoa, nimeltään x-bar (x̄) tai otoskeskiarvo, jotta lähestytään 5 '4 ": n populaatiokeskiarvoa riippumatta siitä, kuinka monta datapistettä (n) sisällytät kukin x-palkki. Ja jos käytät suurempia näytteitä, kuten 100 ihmistä tai koiraa kerrallaan 10 sijasta, voit odottaa molempia yksittäinen x̄ on lähempänä todellista keskiarvoa ja että lähemmäksi tätä on keskimäärin laskettava vähemmän x̄-esiintymiä todellinen keskiarvo.
Esimerkiksi, jos valitset kolme naista, et olisi yllättynyt, jos heidän keskimääräinen korkeus olisi 5 '9 "tai 5' 1" koska yksi erittäin pitkä tai hyvin lyhyt "outlier" voi heittää keskimäärin paljon, kun datapisteitä on pieni.
Mutta jos tekisit toistuvia kokeita 100 naisella ja näisit x-bar-arvot 5 '8,2 ", 5' 7,3" ja niin edelleen, sinulla olisi syytä johtopäätöksen, että auditorion 500 väestön otos ei itse asiassa ollut satunnaisesti valittu otos amerikkalaisista naisista.
X-Bar-laskin
Löydät minkä tahansa näytteen x-bar-arvon nopeasti viittaamalla Resurssit-sivun kaltaiselle sivulle. Näiden arvojen yhteenveto otantajakauman saamiseksi voit käyttää taulukkolaskentaohjelmia, kuten Microsoft Excel tai Google Sheets, joissa on erilaisia valmiiksi pakattuja tilastollisia työkaluja tällaisiin käyttötarkoituksiin.