Velikost vzorca je štetje posameznih vzorcev ali opazovanj v katerem koli statističnem okolju, kot je znanstveni poskus ali raziskava javnega mnenja. Čeprav je koncept razmeroma preprost, je izbira velikosti vzorca ključna odločitev za projekt. Premajhen vzorec daje nezanesljive rezultate, medtem ko prevelik vzorec zahteva veliko časa in sredstev.
TL; DR (predolgo; Nisem prebral)
Velikost vzorca je neposredno štetje števila izmerjenih vzorcev ali opravljenih opazovanj.
Opredelitev velikosti vzorca
Velikost vzorca meri število posameznih izmerjenih vzorcev ali opazovanj, uporabljenih v anketi ali poskusu. Če na primer preizkusite 100 vzorcev zemlje na kisli dež, je velikost vzorca 100. Če je spletna anketa vrnila 30.500 izpolnjenih vprašalnikov, je vaš vzorec 30.500. V statistiki velikost vzorca je na splošno predstavljena s spremenljivko "n".
Izračun velikosti vzorca
Za določitev velikosti vzorca, potrebnega za poskus ali raziskavo, raziskovalci upoštevajo številne želene dejavnike. Najprej,
Nevarnosti majhne velikosti vzorca
Za natančnost in zanesljivost statističnih podatkov so potrebne velike velikosti vzorcev, zlasti če je treba njene ugotovitve ekstrapolirati na večjo populacijo ali skupino podatkov. Recimo, da ste izvedli anketo o vadbi in da ste opravili razgovor s petimi ljudmi, od katerih sta dva dejala, da vsako leto pretečeta maraton. Če vzamete to anketo za predstavitev prebivalstva države kot celote, potem glede na po vaši raziskavi 40 odstotkov ljudi letno preteče vsaj en maraton - nepričakovano visoko odstotek. Manjša kot je velikost vzorca, večja je verjetnost odstopanja - nenavadni podatki - pokvarijo vaše ugotovitve.
Velikost vzorca in napaka
Velikost vzorca statistične raziskave je tudi neposredno povezana z mejo napake v anketi. Napaka je odstotek, ki izraža verjetnost, da so prejeti podatki točni. Na primer, v raziskavi o verskih prepričanjih je meja napake odstotek anketirancev, za katere se lahko pričakuje, da bodo dali enak odgovor, če bi anketo ponovili. Za določitev meje napake: delite 1 s kvadratnim korenom velikosti vzorca in nato pomnožite s 100, da dobite odstotek. Na primer, velikost vzorca 2.400 bo imela napako 2,04 odstotka.