Otoksen koko on yksittäisten näytteiden tai havaintojen laskeminen missä tahansa tilastollisessa ympäristössä, kuten tieteellisessä kokeessa tai yleisen mielipiteen kyselyssä. Vaikka otoksen koko on suhteellisen yksinkertainen käsite, ratkaiseva ratkaisu projektille on otoksen koon valinta. Liian pieni otos tuottaa epäluotettavia tuloksia, kun taas liian suuri otos vaatii paljon aikaa ja resursseja.
TL; DR (liian pitkä; Ei lukenut)
Näytekoko on suoraan mitattujen näytteiden tai tehtyjen havaintojen lukumäärä.
Näytteen koon määritelmä
Näytteen koko mittaa yksittäisten mitattujen näytteiden tai tutkimuksessa tai kokeessa käytettyjen havaintojen määrää. Esimerkiksi, jos testaat 100 näytettä maaperästä happosateiden varalta, näytekoko on 100. Jos verkkokysely palautti 30 500 täytettyä kyselylomaketta, otoskokosi on 30 500. Tilastoissa otoksen kokoa edustaa yleensä muuttuja "n".
Näytteen koon laskeminen
Kokeessa tai tutkimuksessa tarvittavan otoskokon määrittämiseksi tutkijat ottavat huomioon useita haluttuja tekijöitä. Ensimmäinen,
Pienen otoskoon vaarat
Tilastojen ollessa tarkkoja ja luotettavia tarvitaan suuria otoskokoja, varsinkin jos sen havainnot ekstrapoloidaan suuremmalle populaatiolle tai tietoryhmälle. Oletetaan, että teit kyselyn liikunnasta ja haastatit viittä ihmistä, joista kaksi kertoi juoksevan maratonin vuosittain. Jos otat tämän kyselyn edustamaan koko maan väestöä, niin tutkimuksesi mukaan 40 prosenttia ihmisistä juoksi ainakin yhden maratonin vuodessa - yllättävän korkea prosenttiosuus. Mitä pienempi näytekoko, sitä todennäköisempi poikkeavia - epätavalliset tiedot - on vääristettävä havaintojasi.
Näytteen koko ja virhemarginaali
Tilastollisen tutkimuksen otoskoko liittyy myös suoraan tutkimuksen virhemarginaaliin. Virhemarginaali on prosenttiosuus, joka ilmaisee todennäköisyyden, että vastaanotetut tiedot ovat tarkkoja. Esimerkiksi uskonnollisia vakaumuksia koskevassa tutkimuksessa virhemarginaali on niiden vastaajien prosenttiosuus, joiden voidaan odottaa antavan saman vastauksen, jos kysely toistetaan. Virhemarginaalin määrittämiseksi jaa 1 näytteen koon neliöjuurella ja kerro sitten 100: lla saadaksesi prosenttiosuuden. Esimerkiksi 2400 otoksen koossa virhemarginaali on 2,04 prosenttia.