La taille de l'échantillon représente le nombre d'observations prises pour effectuer une analyse statistique. La taille des échantillons peut être composée de personnes, d'animaux, de lots d'aliments, de machines, de batteries ou de toute autre population évaluée.
Échantillonnage aléatoire
L'échantillonnage aléatoire est une méthode par laquelle des échantillons aléatoires sont collectés à partir d'une population afin d'estimer des informations sur la population sans être biaisés. Par exemple, si vous voulez savoir quel type de personnes vivent dans une certaine ville, vous devez interviewer/mesurer différentes personnes au hasard. Cependant, si vous utilisiez simplement tout le monde de la bibliothèque, vous n'auriez pas une estimation juste/impartiale de la population générale qui occupe la ville, juste les personnes qui vont à la bibliothèque.
Précision
À mesure que la taille des échantillons augmente, les estimations deviennent plus précises. Par exemple, si nous sélectionnons au hasard 10 hommes adultes, nous pourrions constater que leur taille moyenne est de 6 pieds 3 pouces, peut-être parce qu'il y a un joueur de basket-ball qui gonfle notre estimation. Si, cependant, nous mesurions deux millions d'hommes adultes, nous aurions un meilleur prédicteur de la taille moyenne de les hommes parce que les extrêmes s'équilibreraient et que la vraie moyenne éclipserait tout écart par rapport à la moyenne.
Intervalles de confiance
Lorsqu'un statisticien fait une prédiction sur un résultat, il construira souvent un intervalle autour de son estimation. Par exemple, si nous mesurions le poids de 100 femmes, nous pourrions dire que nous sommes convaincus à 90 % que le vrai poids moyen des femmes se situe dans l'intervalle de 103 à 129 livres. (Ceci, bien sûr, dépend également d'autres facteurs comme la variabilité des mesures.) À mesure que la taille de l'échantillon augmente, nous devenons plus confiants quant à notre estimation et nos intervalles deviennent plus petits. Par exemple, avec un million de femmes, nous pourrions dire que nous sommes convaincus à 98 % que le vrai poids moyen des femmes se situe entre 115 et 117 livres. En d'autres termes, à mesure que la taille de l'échantillon augmente, notre confiance dans nos mesures augmente et la taille de nos intervalles de confiance diminue.
Erreur standard
La variation est une mesure de la dispersion des données autour de la moyenne. L'écart type est la racine carrée de la variation et permet d'estimer quel pourcentage de la population se situe entre une plage de valeurs par rapport à la moyenne. À mesure que la taille de l'échantillon augmente, l'erreur type, qui dépend de l'écart type et de la taille de l'échantillon, diminue. Par conséquent, les estimations gagnent en précision et la recherche fondée sur ces estimations est considérée comme plus fiable (avec moins de risque d'erreur).
Difficulté à utiliser des échantillons de plus grande taille
De plus grandes tailles d'échantillons produisent évidemment des estimations meilleures et plus précises sur les populations, mais il y a plusieurs problèmes avec les chercheurs qui utilisent des tailles d'échantillons plus grandes. Tout d'abord, il peut être difficile de trouver un échantillon aléatoire de personnes prêtes à essayer un nouveau médicament. Lorsque vous le faites, il devient plus coûteux de fournir le médicament à plus de personnes et de surveiller plus de personnes au fil du temps. De plus, il faut plus d'efforts pour obtenir et maintenir une taille d'échantillon plus importante. Même si des tailles d'échantillon plus grandes produisent des statistiques plus précises, le coût et l'effort supplémentaires ne sont pas toujours nécessaires car des tailles d'échantillon plus petites peuvent également produire des résultats significatifs.