Recimo da znate da je prosječna visina Amerikanke blizu 1,66 m. Recimo da su vam također rekli da je gledalište u kojem stoji 500 odraslih žena savršeno reprezentativan uzorak američke populacije. Odnosno, možete pošteno očekivati da će i prosječna visina žena u gledalištu biti 5 '4 ".
Ako biste nasumce izabrali troje ljudi za izlazak iz sobe, biste li očekivali da prosječna, ili srednja, visina bude točno 5 '4 "? Zašto ili zašto ne? Što ako ste umjesto toga odabrali 10 ljudi? Ili 100? Nadalje, recimo da ste ponovili pokus mjerenja visine tri slučajno odabrane žene u sobi, a zatim u prosjeku ove prosjeci?
S vremenom biste mogli očekivati prosjek ovih prosjeka, od kojih se svaki naziva x-traka (x̄) ili srednja vrijednost uzorka, približiti se srednjem broju stanovništva od 5 '4 ". A ako ste koristili veće uzorke, očekivali biste da će se ovo približavanje sredstava uzorkovanja i istinitih (populacija) sredstava dogoditi brže. Ali zašto?
Statistika stanovništva
Odgovori na gornja pitanja leže u statističkom području
raspodjele uzorkovanja. Ali prvo, neke su terminologije i definicije u redu.Prosjek populacije je prihvaćena, empirijski određena vrijednost koja se odnosi na najveću moguću skupinu pojedinaca koje proučavate. Dakle, ako vaše gledalište sadrži 500 Amerikanki, čitav niz Amerikanki implicira veću populaciju.
str predstavlja sličan koncept: Poznata populacija proporcija, kao što je "udio pasa širom svijeta koji mogu pretrčati preko 15 kilometara na sat iznosi 0,40 (40 posto)." p̂, nazvan "p-šešir", prosječni je udio pronađen nakon uzimanja određenog broja uzoraka iste veličine (npr. 10 pasa) od velike populacije.
Na primjer, jedna skupina od 10 nasumično odabranih pasa može imati prosječnu brzinu od 17,8 MPH, sljedeća 14,3 MPH, sljedeća 12,8 MPH i tako dalje dok ne analizirate onoliko uzoraka koliko želite.
Statistika uzorkovanja
Raspodjele uzorkovanja omogućuju vam da utvrdite je li bazen iz kojeg uzimate uzorke uistinu reprezentativan za veću populaciju. To je zato što, prema Teorem središnje granice, kao broj x-traka (x̄) porast, grafikon njihova prosjeka i njihove raspodjele bit će sličan grafikonu stvarne prosječne populacije. Odnosno, to će biti normalna (zvonasta) raspodjela.
Natrag na žene u gledalištu: Vremenom biste mogli očekivati prosjek ovih prosjeka, nazvan x-bar (x̄) ili srednjoj vrijednosti uzorka, približiti se populacijskoj sredini od 5 '4 "bez obzira u koliko točaka podataka (n) uključili svaki x-bar. A ako koristite veće uzorke, poput 100 ljudi ili pasa istodobno, umjesto 10, očekivali biste i oba pojedinačni x̄ bit će bliži istinskoj srednjoj vrijednosti i potrebno je usredsrediti manje primjera x̄ da bi se približili ovom istinska srednja vrijednost.
Na primjer, ako odaberete tri žene, ne biste se iznenadili ako im je prosječna visina 5 '9 "ili 5' 1" jer jedan vrlo visok ili vrlo nizak "outlier" može izbaciti prosjek puno kada je broj podatkovnih točaka mali.
Ali ako biste izvršili ponovljena ispitivanja na 100 žena i vidjeli x-bar vrijednosti 5 '8,2 ", 5' 7,3", i tako dalje, imali biste razloga zaključiti da uzorak populacije od 500 u gledalištu zapravo nije bio slučajno odabrani uzorak američkih žena.
X-Bar kalkulator
Vrijednost x-bara za bilo koji uzorak možete brzo pronaći pozivom na stranicu poput one u Resursima. Da biste zbrojili ove vrijednosti da biste dobili raspodjelu uzorka, možete koristiti programe za proračunske tablice kao što su Microsoft Excel ili Google Sheets koji imaju razne pretpakirane statističke alate za takve svrhe.