Mărimea eșantionului reprezintă numărul de observații luate pentru efectuarea unei analize statistice. Dimensiunile eșantionului pot fi compuse din oameni, animale, loturi de alimente, mașini, baterii sau orice altă populație care este evaluată.
Eșantionare aleatorie
Eșantionarea aleatorie este o metodă prin care eșantioanele aleatorii sunt colectate dintr-o populație pentru a estima informații despre populație fără a fi părtinitoare. De exemplu, dacă doriți să știți ce tip de oameni trăiesc într-un anumit oraș, trebuie să intervievați / să măsurați diferiți oameni la întâmplare. Cu toate acestea, dacă ai folosi toți oamenii din bibliotecă, nu ai avea o estimare corectă / imparțială a modului în care sunt populația generală care ocupă orașul, ci doar oamenii care merg la bibliotecă.
Precizie
Pe măsură ce dimensiunile eșantionului cresc, estimările devin mai exacte. De exemplu, dacă am selectat aleatoriu 10 bărbați adulți, am putea găsi că înălțimea medie este de 6 picioare-3 inci înălțime, probabil pentru că există un jucător de baschet care ne umflă estimarea. Cu toate acestea, dacă am măsura două milioane de bărbați adulți, am avea un predictor mai bun al înălțimii medii a masculi, deoarece extremele s-ar echilibra și media adevărată ar umbri orice abateri de la Rău.
Intervale de încredere
Când un statistician face o predicție despre un rezultat, el va construi adesea un interval în jurul estimării sale. De exemplu, dacă am măsura greutatea a 100 de femei, am putea spune că suntem încrezători la 90% că greutatea medie reală a femeilor este în intervalul de 103 până la 129 de lire sterline. (Aceasta, desigur, depinde și de alți factori, cum ar fi variabilitatea măsurătorilor.) Pe măsură ce mărimea eșantionului crește, devenim mai încrezători în estimarea noastră, iar intervalele noastre devin mai mici. De exemplu, cu un milion de femei, am putea spune că suntem încrezători cu 98% că greutatea medie reală a femeilor este între 115 și 117 lire sterline. Cu alte cuvinte, pe măsură ce mărimea eșantionului crește, încrederea noastră în măsurătorile noastre crește și dimensiunea intervalelor noastre de încredere scade.
Eroare standard
Variația este o măsură a răspândirii datelor în jurul valorii medii. Abaterea standard este rădăcina pătrată a variației și ajută la aproximarea procentului din populație care se încadrează între un interval de valori raportat la medie. Pe măsură ce mărimea eșantionului crește, eroarea standard, care depinde de abaterea standard și de mărimea eșantionului, scade. În consecință, creșterea estimărilor în precizie și cercetările bazate pe aceste estimări sunt considerate mai fiabile (cu un risc mai mic de eroare).
Dificultate în utilizarea dimensiunilor mai mari ale eșantionului
Dimensiunile mai mari ale eșantionului produc, în mod evident, estimări mai bune și mai exacte despre populații, dar există mai multe probleme cu cercetătorii care folosesc eșantioane mai mari. În primul rând, poate fi greu să găsești un eșantion aleatoriu de oameni dispuși să încerce un nou medicament. Când o faceți, devine mai costisitor să furnizați medicamentul pentru mai mulți oameni și să monitorizați mai mulți oameni în timp. În plus, este nevoie de mai mult efort pentru a obține și a menține o dimensiune mai mare a eșantionului. Chiar dacă dimensiunile mai mari ale eșantionului produc statistici mai precise, costul și efortul suplimentar nu sunt întotdeauna necesare, deoarece dimensiunile mai mici ale eșantionului pot produce și rezultate semnificative.