Povedzme, že viete, že priemerná výška Američanky je takmer 1,63 m. Povedzme, že vám bolo povedané aj to, že hľadisko, v ktorom stojí 500 dospelých žien, je dokonale reprezentatívnou vzorkou americkej populácie. To znamená, že môžete celkom očakávať, že priemerná výška žien v hľadisku bude tiež 5 '4 ".
Ak by ste náhodne vybrali troch ľudí na opustenie miestnosti, čakali by ste, že priemerná alebo priemerná výška ich výšok bude presne 5 '4 "? Prečo áno alebo prečo nie? Čo keby ste si namiesto toho vybrali 10 ľudí? Alebo 100? Ďalej povedzme, že ste opakovali experiment merania výšok troch náhodne vybraných žien v miestnosti znova a znova a potom priemerne títo priemery?
Postupom času môžete očakávať priemer týchto priemerov, z ktorých sa každý volá x-bar (x̄) alebo výberový priemer, priblížiť sa k priemeru populácie 5 '4 ". A ak by ste použili väčšie vzorky, čakali by ste, že táto konvergencia vzorkovacích prostriedkov a skutočných (populácia) znamená, že nastanú rýchlejšie. Ale prečo?
Štatistika obyvateľstva
Odpovede na vyššie uvedené otázky spočívajú v štatistickej oblasti vzorkovanie distribúcie. Najskôr je však istá terminológia a definície v poriadku.
Priemerná populácia je akceptovaná empiricky určená hodnota vzťahujúca sa na čo najväčšiu skupinu študovaných jednotlivcov. Ak teda vaše hľadisko obsahuje 500 amerických žien, celá skupina amerických žien je implikovanou väčšou populáciou.
p predstavuje podobný koncept: Známa populácia pomerný, ako napríklad „podiel psov na celom svete, ktoré môžu bežať viac ako 15 míľ za hodinu, je 0,40 (40 percent).“ p̂„P-hat“ je priemerný podiel zistený po odobratí množstva vzoriek rovnakej veľkosti (napr. 10 psov) z najväčšej populácie.
Napríklad jedna skupina 10 náhodne vybraných psov môže mať priemernú rýchlosť 17,8 MPH, ďalších 14,3 MPH, ďalších 12,8 MPH atď., Kým nebudete analyzovať toľko vzoriek, koľko chcete.
Štatistika vzorkovania
Distribúcie vzoriek vám umožňujú určiť, či skupina, z ktorej odoberáte vzorky, skutočne reprezentuje väčšiu populáciu. Je to preto, lebo podľa Centrálna limitná veta, ako počet x-bar (x̄) stúpa, graf ich priemeru a ich rozdelenia sa bude podobať skutočnému priemeru populácie. To znamená, že pôjde o normálne (zvonovité) rozdelenie.
Späť k ženám v hľadisku: Postupom času môžete očakávať priemer týchto priemerov, ktorý sa nazýva x-bar (x̄) alebo priemer vzorky, aby ste sa priblížili k priemeru populácie 5 '4 "bez ohľadu na to, koľko údajových bodov (n) zahrniete každý x-bar. A ak použijete väčšie vzorky, napríklad 100 ľudí alebo psov naraz namiesto 10, čakali by ste oboje jednotlivec x̄ bude bližšie k skutočnému priemeru a že je potrebné spriemerovať menej prípadov x̄, aby sa to priblížilo skutočný priemer.
Ak by ste si napríklad vybrali tri ženy, nečudovali by ste sa, keby ich priemerná výška bola 5 '9 "alebo 5' 1" pretože jediný veľmi vysoký alebo veľmi krátky „odľahlý“ môže pri priemernom počte dátových bodov vyhodiť priemer veľa malý.
Ak by ste však vykonali opakované pokusy so 100 ženami a videli by ste hodnoty x-bar 5 '8,2 ", 5' 7,3" atď., Mali by ste dôvod na dospeli k záveru, že 500-členná populácia v hľadisku nebola v skutočnosti náhodne vybranou vzorkou amerických žien.
X-Bar kalkulačka
Hodnotu x-bar pre každú vzorku nájdete rýchlo tak, že sa pozriete na stránku, ako je tá v Zdrojoch. Ak chcete tieto hodnoty sčítať a získať distribúciu vzorkovania, môžete použiť tabuľkové programy, ako napríklad Microsoft Excel alebo Tabuľky Google, ktoré majú na tieto účely vopred pripravené rôzne štatistické nástroje.