Ko gre za znanstvene študije, je velikost vzorca ključnega pomena za kakovostne raziskave. Velikost vzorca, včasih predstavljena kot n, je število posameznih podatkov, ki se uporabljajo za izračun nabora statističnih podatkov. Večje velikosti vzorcev omogočajo raziskovalcem, da bolje določijo povprečne vrednosti svojih podatkov in se izognejo napakam pri testiranju majhnega števila morebiti netipičnih vzorcev.
TL; DR (predolgo; Nisem prebral)
Velikost vzorca je pomemben dejavnik raziskav. Večje velikosti vzorcev zagotavljajo natančnejše povprečne vrednosti, opredeljujejo odstopanja, ki bi lahko prikrivala podatke v manjšem vzorcu in manjšo napako.
Velikost vzorca
Velikost vzorca je število podatkov, preizkušenih v anketi ali poskusu. Če na primer testirate 100 vzorcev morske vode na oljne ostanke, je velikost vzorca 100. Če anketirate 20.000 ljudi zaradi znakov tesnobe, je vaš vzorec 20.000. Večja velikost vzorcev ima očitno prednost, da raziskovalcem zagotavlja več podatkov; vendar veliki poskusi z velikostjo vzorca zahtevajo večje finančne in časovne obveznosti.
Povprečna vrednost in odstopanja
Večje velikosti vzorcev pomagajo določiti povprečno vrednost kakovosti med preizkušenimi vzorci - to povprečje je pomeni. Večja kot je velikost vzorca, bolj natančna je srednja vrednost. Če na primer ugotovite, da je med 40 ljudmi povprečna višina 5 čevljev in 4 palca, med 100 ljudmi pa povprečna višina 5 čevljev, 3 palcev, je druga meritev boljša ocena povprečne višine posameznika, saj testirate bistveno več predmeti. Določanje povprečja raziskovalcem omogoča tudi lažje določanje odstopanja. Izstopajoč je del podatkov, ki se močno razlikuje od srednje vrednosti in lahko predstavlja zanimivost za raziskave. Glede na povprečno višino bi bil nekdo z višino 6 čevljev 8 centimetrov oddaljena podatkovna točka.
Nevarnost majhnih vzorcev
Možnost odstopanja je del tistega, zaradi česar je pomembna velika velikost vzorca. Recimo, da anketirate štiri osebe o njihovi politični pripadnosti, eden pa pripada neodvisni stranki. Ker gre za enega posameznika v vzorcu 4, bo vaša statistika pokazala, da 25 odstotkov prebivalstva pripada Neodvisni stranki, kar je verjetno netočna ekstrapolacija. Če povečate velikost vzorca, se boste izognili zavajajočim statističnim podatkom, če je v vzorcu prisoten kakšen odmik.
Napaka
Velikost vzorca je neposredno povezana s statističnimi podatki meja napakeali kako natančno je mogoče izračunati statistiko. Za vprašanje z da ali ne, na primer, ali je posameznik lastnik avtomobila, lahko določite mejo napaka za statistiko tako, da se 1 deli s kvadratnim korenom velikosti vzorca in pomnoži z 100. Skupaj je odstotek. Na primer, velikost vzorca 100 bo imela 10-odstotno napako. Pri merjenju številskih lastnosti s srednjo vrednostjo, kot sta višina ali teža, to skupno število pomnožite z dvakratno vrednostjo standardni odklon podatkov, ki meri, kako razporejene so vrednosti podatkov od povprečja. V obeh primerih je večja velikost vzorca, manjša je napaka.