Când vine vorba de studii științifice, dimensiunea eșantionului este un aspect crucial pentru cercetarea de calitate. Dimensiunea eșantionului, uneori reprezentată ca n, este numărul de date individuale utilizate pentru a calcula un set de statistici. Dimensiunile mai mari ale eșantioanelor permit cercetătorilor să determine mai bine valorile medii ale datelor lor și să evite erorile de la testarea unui număr mic de eșantioane posibil atipice.
TL; DR (Prea lung; Nu am citit)
Mărimea eșantionului este un aspect important pentru cercetare. Dimensiunile mai mari ale eșantionului oferă valori medii mai precise, identifică valori aberante care ar putea distorsiona datele într-un eșantion mai mic și ar oferi o marjă de eroare mai mică.
Marime de mostra
Mărimea eșantionului reprezintă numărul de informații testate într-un sondaj sau un experiment. De exemplu, dacă testați 100 de probe de apă de mare pentru reziduuri de petrol, dimensiunea probei dvs. este de 100. Dacă examinați 20.000 de persoane pentru semne de anxietate, dimensiunea eșantionului dvs. este de 20.000. Eșantioanele mai mari au avantajul evident de a furniza mai multe date pentru care cercetătorii să poată lucra; dar experimentele de dimensiuni mari ale eșantionului necesită angajamente financiare și de timp mai mari.
Valoarea medie și valorile aberante
Dimensiunile mai mari ale probelor ajută la determinarea valorii medii a unei calități printre eșantioanele testate - această medie este Rău. Cu cât eșantionul este mai mare, cu atât este mai precisă media. De exemplu, dacă descoperiți că, în rândul a 40 de persoane, înălțimea medie este de 5 picioare, 4 inci, dar între 100 de persoane, înălțimea medie este de 5 picioare, 3 inch, a doua măsurare este o estimare mai bună a înălțimii medii a unei persoane, deoarece testați mult mai mult subiecte. Determinarea mediei permite, de asemenea, cercetătorilor să identifice mai ușor valori aberante. Un outlier este o informație care diferă puternic de valoarea medie și poate reprezenta un punct de interes pentru cercetare. Deci, pe baza înălțimii medii, cineva cu o înălțime de 6 picioare și 8 inci ar fi un punct de date periferic.
Pericolul eșantioanelor mici
Posibilitatea valorilor aberante face parte din ceea ce face importantă dimensiunea eșantionului mare. De exemplu, să spunem că chestionați 4 persoane despre apartenența lor politică, iar una aparține partidului Independent. Deoarece acesta este un individ dintr-un eșantion de 4, statistica dvs. va arăta că 25% din populație aparține partidului Independent, probabil o extrapolare inexactă. Creșterea dimensiunii eșantionului va evita statistici înșelătoare dacă este prezent un eșantion în eșantion.
Marja de eroare
Dimensiunea eșantionului este direct legată de statistică marja de eroare, sau cât de exactă poate fi calculată o statistică. Pentru o întrebare da-sau-nu, cum ar fi dacă o persoană deține o mașină, puteți determina marja eroare pentru o statistică prin împărțirea 1 la rădăcina pătrată a mărimii eșantionului și înmulțirea cu 100. Totalul este un procent. De exemplu, o dimensiune a eșantionului de 100 va avea o marjă de eroare de 10%. Când măsurați calități numerice cu o valoare medie, cum ar fi înălțimea sau greutatea, înmulțiți acest total cu de două ori deviație standard a datelor, care măsoară cât de răspândite sunt valorile datelor din medie. În ambele cazuri, cu cât eșantionul este mai mare, cu atât este mai mică marja de eroare.