Velikost vzorca predstavlja število opazovanj, opravljenih za izvedbo statistične analize. Velikosti vzorcev lahko sestavljajo ljudje, živali, serije hrane, stroji, baterije ali kar koli drugega prebivalstva, ki se ocenjuje.
Naključno vzorčenje
Naključno vzorčenje je metoda, s katero se naključni vzorci zbirajo iz populacije, da se ocenijo podatki o populaciji, ne da bi bili pristranski. Če želite na primer vedeti, kakšne vrste ljudi živijo v določenem mestu, morate naključno intervjuvati / meriti različne ljudi. Če pa bi pravkar uporabili vse iz knjižnice, ne bi imeli poštene / nepristranske ocene, kakšna je splošna populacija, ki zaseda mesto, samo ljudje, ki hodijo v knjižnico.
Natančnost
Ko se velikost vzorcev poveča, postanejo ocene natančnejše. Če bi na primer naključno izbrali 10 odraslih moških, bi lahko ugotovili, da je njihova povprečna višina visoka 6 čevljev, morda zato, ker naš košarkar napihne košarkarja. Če pa bi izmerili dva milijona odraslih moških, bi imeli boljši napovednik srednje višine moški, ker bi se ekstremi uravnotežili in bi resnično povprečje zasenčilo vsa odstopanja od pomeni.
Intervali zaupanja
Ko statistik predvidi izid, bo pogosto zgradil interval okoli svoje ocene. Če bi na primer izmerili težo 100 žensk, bi lahko rekli, da smo 90-odstotno prepričani, da je resnična povprečna teža žensk v razponu od 103 do 129 kilogramov. (To je seveda odvisno tudi od drugih dejavnikov, kot je spremenljivost meritev.) Ko se velikost vzorca povečuje, postajamo bolj samozavestni glede svoje ocene in naši intervali manjši. Na primer, z milijonom žensk bi lahko rekli, da smo 98-odstotno prepričani, da je resnična povprečna teža žensk med 115 in 117 kilogrami. Z drugimi besedami, ko se velikost vzorca poveča, se naše zaupanje v meritve poveča in velikost intervalov zaupanja zmanjša.
Standardna napaka
Variacija je merilo širjenja podatkov okoli povprečja. Standardni odklon je kvadratni koren variacije in pomaga približati odstotek populacije med območjem vrednosti glede na srednjo vrednost. Ko se velikost vzorca poveča, se standardna napaka, ki je odvisna od standardnega odklona in velikosti vzorca, zmanjša. Posledično se poveča natančnost ocen in raziskave, ki temeljijo na teh ocenah, veljajo za bolj zanesljive (z manjšim tveganjem za napake).
Težave pri uporabi večjih vzorčnih velikosti
Večje velikosti vzorcev očitno dajejo boljše in natančnejše ocene populacij, vendar obstaja več težav z raziskovalci, ki uporabljajo večje velikosti vzorcev. Najprej je morda težko najti naključni vzorec ljudi, ki so pripravljeni preizkusiti novo zdravilo. Ko to storite, je dražje zagotoviti zdravilo več ljudem in sčasoma spremljati več ljudi. Poleg tega si je treba bolj potruditi, da pridobimo in ohranimo večjo velikost vzorca. Tudi če večje velikosti vzorcev dajejo natančnejše statistične podatke, dodatni stroški in napor niso vedno potrebni, saj lahko tudi manjše velikosti vzorcev prinesejo pomembne rezultate.