Sakiet, ka zināt, ka amerikāņu sievietes vidējais augums ir tuvu 5 pēdām, 4 collām (apmēram 1,63 m). Pieņemsim, ka jums arī teica, ka auditorija, kurā stāv 500 pieaugušo sieviešu, ir pilnīgi reprezentatīva Amerikas iedzīvotāju izlase. Tas ir, jūs varat diezgan sagaidīt, ka sieviešu vidējais augstums auditorijā būs arī 5 '4 ".
Ja jūs izvēlētos trīs cilvēkus nejauši, lai izietu no istabas, vai jūs domājat, ka viņu vidējais vai vidējais augstums ir tieši 5 '4 "? Kāpēc vai kāpēc ne? Ko darīt, ja jūs izvēlētos 10 cilvēkus? Vai 100? Pieņemsim, ka atkārtojāt trīs nejauši izvēlētu sieviešu augstuma mērīšanas eksperimentu telpā un pēc tam vidēji šie vidējie rādītāji?
Laika gaitā jūs varētu sagaidīt vidējo no šiem vidējiem rādītājiem, no kuriem katrs tiek saukts x-josla (x̄) vai vidējais paraugs, lai tuvotos 5 '4 "iedzīvotāju vidējam skaitlim. Un, ja jūs izmantotu lielākas izlases, jūs varētu sagaidīt, ka šī izlases līdzekļu un patieso (populācijas) līdzekļu konverģence notiks ātrāk. Bet kāpēc?
Iedzīvotāju statistika
Atbildes uz iepriekš minētajiem jautājumiem ir izlases sadalījumi. Bet vispirms dažas terminoloģijas un definīcijas ir kārtībā.
Vidējais iedzīvotāju skaits ir pieņemta, empīriski noteikta vērtība, kas attiecas uz iespējami lielāko iespējamo personu grupu, kuru jūs pētāt. Tādējādi, ja jūsu auditorijā ir 500 amerikāņu sievietes, viss amerikāņu sieviešu kopums ir domāts lielākam iedzīvotāju skaitam.
lpp pārstāv līdzīgu jēdzienu: Zināma populācija proporcija, piemēram, "suņu īpatsvars visā pasaulē, kas var skriet vairāk nekā 15 jūdzes stundā, ir 0,40 (40 procenti)". p̂, ko sauc par "p-cepuri", ir vidējā proporcija, kas konstatēta pēc tam, kad ir ņemti vairāki vienāda lieluma paraugi (piemēram, 10 suņi) no lielās populācijas.
Piemēram, vienas 10 nejauši izvēlētu suņu grupas vidējais ātrums varētu būt 17,8 MPH, nākamais 14,3 MPH, nākamais 12,8 MPH un tā tālāk, līdz esat analizējis tik daudz paraugu, cik vēlaties.
Izlases statistika
Izlases sadalījums ļauj noteikt, vai kopa, no kuras ņemat paraugus, patiešām pārstāv lielāko iedzīvotāju skaitu. Tas ir tāpēc, ka saskaņā ar Centrālās robežas teorēma, kā numuru x-josla (x̄) pieaugums, to vidējā un to sadalījuma grafiks atgādinās patiesā populācijas vidējo. Tas ir, tas būs normāls (zvana formas) sadalījums.
Atpakaļ pie sievietēm auditorijā: Laika gaitā jūs varētu sagaidīt šo vidējo rādītāju vidējo lielumu, ko sauc par x-bar (x̄) vai izlases vidējais rādītājs, lai tuvotos 5 '4 "vidējam skaitlim neatkarīgi no tā, cik daudz datu punktu (n) jūs iekļaujat katrs x josla. Un, ja jūs izmantojat lielākus paraugus, piemēram, 100 cilvēkus vai suņus vienlaikus, nevis 10, jūs sagaidāt, ka katrs no tiem individuālais x̄ būs tuvāk patiesajam vidējam līmenim un ka, lai tuvotos šim, ir jāreģistrē mazāk x̄ gadījumu patiesais vidējais.
Piemēram, ja izvēlaties trīs sievietes, jūs nebrīnīsieties, ja viņu vidējais augstums būtu 5 '9 "vai 5' 1" jo viens ļoti augsts vai ļoti īss "novirzītājs" var daudz izmest vidēji, ja datu punktu skaits ir mazs.
Bet, ja jūs veiktu atkārtotus 100 sieviešu izmēģinājumus un redzētu x-bar vērtības 5 '8,2 ", 5' 7,3" utt., Jums būtu pamats secināt, ka auditorijas 500 iedzīvotāju izlase patiesībā nebija nejauši izvēlēta amerikāņu sieviešu izlase.
X-Bar kalkulators
Varat ātri atrast jebkura parauga x-bar vērtību, atsaucoties uz tādu lapu kā Resursi. Apkopojot šīs vērtības, lai iegūtu izlases sadalījumu, varat izmantot izklājlapu programmas, piemēram, Microsoft Excel vai Google Sheets, kurām ir dažādi fasēti statistikas rīki šādiem lietojumiem.