Pokiaľ ide o vedecké štúdie, veľkosť vzorky je rozhodujúcim faktorom pre kvalitný výskum. Veľkosť vzorky, niekedy vyjadrená ako n, je počet jednotlivých údajov použitých na výpočet súboru štatistík. Väčšie veľkosti vzoriek umožňujú výskumníkom lepšie určiť priemerné hodnoty ich údajov a zabrániť chybám pri testovaní malého počtu pravdepodobne atypických vzoriek.
TL; DR (príliš dlhý; Nečítali)
Veľkosť vzorky je dôležitým hľadiskom pre výskum. Väčšie veľkosti vzorky poskytujú presnejšie stredné hodnoty, identifikujú odľahlé hodnoty, ktoré by mohli skresliť údaje v menšej vzorke a poskytujú menšiu mieru chyby.
Veľkosť vzorky
Veľkosť vzorky je počet informácií testovaných v rámci prieskumu alebo experimentu. Ak napríklad testujete zvyšky oleja v 100 vzorkách morskej vody, veľkosť vašej vzorky je 100. Ak zisťujete príznaky úzkosti u 20 000 ľudí, veľkosť vašej vzorky je 20 000. Väčšie veľkosti vzoriek majú zjavnú výhodu v poskytovaní väčšieho množstva údajov pre výskumných pracovníkov; ale veľké experimenty s veľkosťou vzorky si vyžadujú väčšie finančné a časové záväzky.
Priemerná hodnota a odľahlé hodnoty
Väčšie veľkosti vzoriek pomáhajú pri určovaní priemernej hodnoty kvality medzi testovanými vzorkami - tento priemer je znamenajú. Čím väčšia je veľkosť vzorky, tým presnejší je priemer. Napríklad, ak zistíte, že medzi 40 ľuďmi je priemerná výška 5 stôp, 4 palce, ale medzi 100 ľuďmi je stredná výška 5 stôp, 3 palce, druhé meranie predstavuje lepší odhad priemernej výšky jednotlivca, pretože testujete podstatne viac predmetov. Stanovenie priemeru tiež umožňuje výskumníkom ľahšie určiť odľahlé hodnoty. Odľahlá hodnota je údaj, ktorý sa výrazne líši od priemernej hodnoty a môže predstavovať zaujímavý bod pre výskum. Na základe priemernej výšky by teda niekto s výškou 6 stôp a 8 palcov bol vzdialený údajový bod.
Nebezpečenstvo malých vzoriek
Možnosť odľahlých hodnôt je súčasťou toho, čo robí dôležitú veľkú veľkosť vzorky. Povedzme napríklad, že robíte prieskum u 4 ľudí o ich politickej príslušnosti a jeden patrí do nezávislej strany. Pretože ide o jedného jedinca vo vzorke s veľkosťou 4, vaša štatistika ukáže, že 25 percent populácie patrí nezávislej strane, čo je pravdepodobne nepresná extrapolácia. Ak sa vo vašej vzorke vyskytne nadmerná hodnota, zvýšením veľkosti vzorky sa vyhnete zavádzajúcim štatistikám.
Marža chyby
Veľkosť vzorky priamo súvisí so štatistikou miera chyby, alebo ako presná štatistika sa dá vypočítať. Pre otázku typu áno alebo nie, napríklad to, či jednotlivec vlastní auto, môžete určiť maržu chyba pre štatistiku vydelením 1 druhou odmocninou veľkosti vzorky a vynásobením 100. Spolu je to percento. Napríklad veľkosť vzorky 100 bude mať 10-percentnú mieru chyby. Pri meraní číselných kvalít so strednou hodnotou, ako je výška alebo hmotnosť, sa tento súčet vynásobí dvojnásobkom hodnoty štandardná odchýlka údajov, ktoré merajú, ako sú rozložené hodnoty údajov od priemeru. V obidvoch prípadoch platí, čím väčšia je veľkosť vzorky, tým menšia je miera chyby.