A minta mérete a statisztikai elemzés elvégzéséhez elvégzett megfigyelések számát jelenti. A mintaméretek állhatnak emberekből, állatokból, élelmiszer-adagokból, gépekből, akkumulátorokból vagy bármilyen más populációból.
Véletlenszerű mintavétel
A véletlenszerű mintavétel egy olyan módszer, amellyel véletlenszerű mintákat gyűjtenek egy populációból annak érdekében, hogy torzítás nélkül megbecsüljék a populációra vonatkozó információkat. Például, ha szeretné tudni, hogy milyen típusú emberek élnek egy bizonyos városban, akkor véletlenszerűen kell interjút készítenie / megmérnie. Ha azonban csak a könyvtárból mindenkit használna, akkor nem lenne tisztességes / elfogulatlan becslése arról, hogy milyen a várost elfoglaló lakosság, csak azok az emberek, akik a könyvtárba járnak.
Pontosság
A mintaméretek növekedésével a becslések pontosabbá válnak. Például, ha véletlenszerűen kiválasztottunk 10 férfi felnőtt embert, akkor átlagmagasságuk 6 láb-3 hüvelyk magas lehet, talán azért, mert van olyan kosárlabdázó, amely növeli becslésünket. Ha azonban megmérnénk kétmillió felnőtt férfi embert, jobban megjósolnánk az átlagos magasságot hímek, mert a szélsőségek kiegyensúlyozódnának, és a valódi átlag beárnyékolná az esetleges eltéréseket átlagos.
Bizalom intervallumok
Amikor egy statisztikus jóslatot tesz egy eredményre, gyakran intervallumot épít a becslése köré. Például, ha megmérnénk 100 nő súlyát, azt mondhatnánk, hogy 90 százalékkal bízunk abban, hogy a nők valódi, átlagos súlya 103 és 129 font között van. (Ez természetesen más tényezőktől is függ, mint például a mérések változékonysága.) A minta méretének növekedésével magabiztosabbá válunk becslésünkben, és az intervallumaink kisebbek lesznek. Például egymillió nővel azt mondhatnánk, hogy 98 százalékban bízunk abban, hogy a nők valódi, átlagos súlya 115 és 117 font között van. Más szavakkal, a minta méretének növekedésével nő a bizalma a méréseinkben, és csökken a konfidencia intervallumaink mérete.
Normál hiba
A variáció az adatok elterjedésének mértéke az átlag körül. A szórás a variáció négyzetgyöke, és segít megbecsülni, hogy a populáció hány százaléka esik az átlaghoz viszonyított értéktartomány közé. A minta méretének növekedésével csökken a szórás és a minta méretétől függő standard hiba. Következésképpen a becslések pontosságának növekedése és az ezekre a becslésekre épülő kutatások megbízhatóbbnak számítanak (kevesebb hibalehetőséggel).
Nehézség a nagyobb mintaméretek használatában
A nagyobb mintaméretek nyilvánvalóan jobb, pontosabb becsléseket eredményeznek a populációkról, de a nagyobb mintanagyságot alkalmazó kutatókkal számos probléma merül fel. Először is nehéz lehet véletlenszerű mintát találni azokról az emberekről, akik hajlandóak kipróbálni egy új drogot. Amikor ezt megteszi, költségesebbé válik a gyógyszer több embernek történő ellátása és az idő múlásával több ember figyelése. Ezenkívül nagyobb erőfeszítéseket igényel a nagyobb mintanagyság megszerzése és fenntartása. Még akkor is, ha a nagyobb mintaméretek pontosabb statisztikákat eredményeznek, nem mindig szükséges a többletköltség és az erőfeszítés, mivel a kisebb mintanagyság is jelentős eredményeket hozhat.