Veľkosť vzorky predstavuje počet pozorovaní vykonaných na vykonanie štatistickej analýzy. Veľkosti vzoriek môžu byť ľudia, zvieratá, dávky potravín, stroje, batérie alebo akákoľvek hodnotená populácia.
Náhodné vzorkovanie
Náhodný výber je metóda, ktorou sa odoberajú náhodné vzorky z populácie s cieľom odhadnúť informácie o populácii bez zaujatosti. Napríklad, ak chcete vedieť, aký typ ľudí žije v určitom meste, musíte náhodne urobiť rozhovor / zmerať rôznych ľudí. Keby ste však práve použili všetkých z knižnice, nemali by ste spravodlivý / nestranný odhad toho, aká je bežná populácia, ktorá mesto obýva, iba ľudia, ktorí chodia do knižnice.
Presnosť
S pribúdajúcimi veľkosťami vzoriek sú odhady presnejšie. Napríklad, ak sme náhodne vybrali 10 dospelých mužov, mohli by sme zistiť, že ich priemerná výška je 6 stôp-3 palce, možno preto, že náš odhad nafukuje basketbalový hráč. Keby sme však zmerali dva milióny dospelých mužov, mali by sme lepší prediktor priemernej výšky muži, pretože by sa vyrovnali extrémy a skutočný priemer by zatienil akékoľvek odchýlky od znamenajú.
Intervaly spoľahlivosti
Keď štatistik predpovedá výsledok, často vytvorí interval okolo svojho odhadu. Napríklad, ak by sme zmerali váhu 100 žien, dalo by sa povedať, že sme si na 90 percent istí, že skutočná priemerná hmotnosť žien je v rozmedzí 103 až 129 libier. (To samozrejme závisí aj od ďalších faktorov, ako je napríklad variabilita meraní.) S pribúdajúcou veľkosťou vzorky získavame čoraz väčšiu istotu pri odhadovaní a intervaly sa zmenšujú. Napríklad s miliónom žien by sme mohli povedať, že sme si na 98 percent istí, že skutočná priemerná hmotnosť žien je medzi 115 a 117 librami. Inými slovami, s rastúcou veľkosťou vzorky sa zvyšuje naša dôvera v naše merania a veľkosť našich intervalov spoľahlivosti klesá.
Štandardná chyba
Variácia je mierou šírenia údajov okolo priemeru. Štandardná odchýlka je druhá odmocnina variácie a pomáha priblížiť, aké percento populácie spadá medzi rozsah hodnôt vzhľadom na priemer. Ako sa veľkosť vzorky zväčšuje, štandardná chyba, ktorá závisí od štandardnej odchýlky a veľkosti vzorky, sa zmenšuje. V dôsledku toho sa odhad presnosti zvyšuje a výskum založený na týchto odhadoch sa považuje za spoľahlivejší (s menším rizikom chyby).
Problémy s používaním väčších vzorových veľkostí
Väčšie veľkosti vzoriek samozrejme vytvárajú lepšie a presnejšie odhady populácií, ale existuje veľa problémov s výskumníkmi, ktorí používajú väčšie veľkosti vzoriek. Najskôr môže byť ťažké nájsť náhodnú vzorku ľudí, ktorí sú ochotní vyskúšať nový liek. Ak to urobíte, stane sa nákladnejšie poskytnúť drogu väčšiemu počtu ľudí a sledovať viac ľudí v priebehu času. Získanie a udržanie väčšej veľkosti vzorky si vyžaduje viac úsilia. Aj keď väčšie veľkosti vzorky vytvárajú presnejšie štatistiky, nie sú vždy potrebné ďalšie náklady a úsilie, pretože menšie veľkosti vzorky môžu tiež priniesť významné výsledky.