La dimensione del campione rappresenta il numero di osservazioni effettuate per condurre un'analisi statistica. Le dimensioni del campione possono essere composte da persone, animali, lotti di cibo, macchine, batterie o qualunque popolazione venga valutata.
Campionamento Casuale
Il campionamento casuale è un metodo mediante il quale vengono raccolti campioni casuali da una popolazione al fine di stimare le informazioni sulla popolazione senza essere distorti. Ad esempio, se vuoi sapere che tipo di persone vivono in una determinata città, devi intervistare/misurare persone diverse a caso. Tuttavia, se usassi tutti dalla biblioteca, non avresti una stima equa/obiettiva di come sia la popolazione generale che occupa la città, solo le persone che vanno in biblioteca.
Precisione
Man mano che le dimensioni del campione aumentano, le stime diventano più accurate. Ad esempio, se selezioniamo a caso 10 uomini adulti maschi, potremmo scoprire che la loro altezza media è di 6 piedi e 3 pollici, forse perché c'è un giocatore di basket che gonfia la nostra stima. Se, tuttavia, misurassimo due milioni di uomini maschi adulti, avremmo un predittore migliore dell'altezza media di maschi perché gli estremi si bilanciano e la media reale metterebbe in ombra eventuali deviazioni dal significare.
Intervalli di confidenza
Quando uno statistico fa una previsione su un risultato, spesso costruisce un intervallo attorno alla sua stima. Ad esempio, se misurassimo il peso di 100 donne, potremmo dire che siamo sicuri al 90% che il vero peso medio delle donne sia compreso tra 103 e 129 libbre. (Questo, ovviamente, dipende anche da altri fattori come la variabilità nelle misurazioni.) Man mano che la dimensione del campione aumenta, diventiamo più sicuri della nostra stima e i nostri intervalli diventano più piccoli. Ad esempio, con un milione di donne, potremmo dire che siamo fiduciosi al 98 percento che il vero peso medio delle donne sia compreso tra 115 e 117 libbre. In altre parole, all'aumentare della dimensione del campione, la nostra fiducia nelle nostre misurazioni aumenta e la dimensione dei nostri intervalli di confidenza diminuisce.
Errore standard
La variazione è una misura della diffusione dei dati attorno alla media. La deviazione standard è la radice quadrata della variazione e aiuta ad approssimare la percentuale della popolazione compresa tra un intervallo di valori relativi alla media. All'aumentare della dimensione del campione, l'errore standard, che dipende dalla deviazione standard e dalla dimensione del campione, diminuisce. Di conseguenza, le stime aumentano in precisione e la ricerca costruita su queste stime è considerata più affidabile (con minor rischio di errore).
Difficoltà nell'uso di campioni di dimensioni maggiori
Campioni di dimensioni maggiori producono ovviamente stime migliori e più accurate sulle popolazioni, ma ci sono diversi problemi con i ricercatori che utilizzano campioni di dimensioni maggiori. Prima di tutto, potrebbe essere difficile trovare un campione casuale di persone disposte a provare un nuovo farmaco. Quando lo fai, diventa più costoso fornire il farmaco a più persone e monitorare più persone nel tempo. Inoltre, è necessario uno sforzo maggiore per ottenere e mantenere una dimensione del campione più ampia. Anche se le dimensioni del campione più grandi producono statistiche più accurate, il costo e lo sforzo extra non sono sempre necessari poiché anche dimensioni del campione più piccole possono produrre risultati significativi.