Mondja, hogy tudja, hogy egy amerikai nő átlagos magassága megközelíti az 5 láb (4 hüvelyk) (kb. 1,63 m) magasságot. Tegyük fel, hogy azt is elmondták, hogy az aula, ahol 500 felnőtt nő áll, tökéletesen reprezentatív minta az amerikai lakosságból. Vagyis meglehetősen számíthat arra, hogy a nézőtéren a nők átlagos magassága is 5 '4 "lesz.
Ha véletlenszerűen három embert választana, hogy kilépjen a szobából, akkor azt gondolná, hogy a magasságuk átlagos vagy átlagos értéke pontosan 5 '4 "lesz? Miért vagy miért nem? Mi lenne, ha 10 embert választana helyette? Vagy 100? Tegyük fel továbbá, hogy megismételte azt a kísérletet, amelyben három véletlenszerűen kiválasztott nő magasságát mérte újra és újra a szobában, majd átlagolta ezek átlagok?
Idővel számíthat ezeknek az átlagoknak az átlagára, amelyek mindegyikét hívják x-bar (x̄) vagy a minta átlag, hogy megközelítsük az 5 '4 "népesség átlagát. És ha nagyobb mintákat használna, akkor azt várná, hogy a mintavételi eszközök és az igaz (populációs) eszközök konvergenciája gyorsabban bekövetkezik. De miért?
Népességi statisztika
A fenti kérdésekre adott válaszok a mintavételi eloszlások. De először is néhány terminológia és definíció rendben van.
A populációs átlag egy elfogadott, empirikusan meghatározott érték, amely a lehető legnagyobb egyéncsoportra vonatkozik. Tehát, ha a nézőtéren 500 amerikai nő található, akkor az amerikai nők teljes csoportja jelenti a nagyobb népességet.
o hasonló koncepciót képvisel: Ismert populáció arány, például "világszerte 15 mérföldet futni képes kutyák aránya 0,40 (40 százalék)". p̂, az úgynevezett "p-hat", az az átlagos arány, amelyet azután találtak, hogy számos azonos méretű mintát (pl. 10 kutyát) vettek a nagy populációból.
Például egy 10 véletlenszerűen kiválasztott kutya csoport átlagsebessége 17,8 MPH, a következő 14,3 MPH, a következő 12,8 MPH és így tovább, amíg annyi mintát nem elemez, amennyit csak akar.
Mintavételi statisztika
A mintavételi eloszlások lehetővé teszik annak megállapítását, hogy a készlet, amelyből mintákat vesz, valóban reprezentatív-e a nagyobb populáció számára. Ennek oka, hogy a Központi korlát tétel, mint a szám x-bar (x̄) Az átlaguk grafikonja és megoszlásuk hasonló lesz a valódi népesség átlagához. Vagyis normális (harang alakú) eloszlás lesz.
Visszatérve a nézőtéren lévő nőkhöz: Idővel számolhat az átlagok átlaga, az úgynevezett x-bar (x̄) vagy a mintaátlag, hogy megközelítsük az 5 '4 "népességátlagot, függetlenül attól, hogy hány adatpontot (n) tartalmaz minden egyes x-bar. És ha nagyobb mintákat használ, például 100 embert vagy kutyát egyszerre, 10 helyett, akkor mindkettőre számíthat az x̄ közelebb lesz az igazi átlaghoz, és ehhez kevesebb x̄ példányt kell átlagolni, hogy közelebb kerülhessünk ehhez igaz jelentése.
Például, ha három nőt választ, akkor nem lepődik meg, ha átlagos magasságuk 5 '9 "vagy 5' 1" mert egyetlen nagyon magas vagy nagyon rövid "kiugró" sokat dobhat egy átlagot, ha az adatpontok száma kicsi.
De ha 100 nő többszöri próbáját futtatná, és az x-bar értékeket 5 '8,2 ", 5' 7,3" stb. Látná, akkor oka lenne arra a következtetésre juthatunk, hogy a nézőtéren az 500 fős népességminta valójában nem véletlenszerűen kiválasztott amerikai nőkből álló minta.
X-Bar kalkulátor
Bármely minta esetében gyorsan megtalálhatja az x-bar értékét, ha egy olyan oldalra hivatkozik, mint amely a Resources-ban található. Ezeknek az értékeknek az összegzéséhez mintavételi eloszlás megszerzéséhez olyan táblázatkezelő programokat használhat, mint a Microsoft Excel vagy a Google Sheets, amelyek különféle előre csomagolt statisztikai eszközökkel rendelkeznek az ilyen használatra.