Lorsqu'il s'agit d'études scientifiques, la taille de l'échantillon est un facteur crucial pour une recherche de qualité. Taille de l'échantillon, parfois représentée par m, est le nombre de données individuelles utilisées pour calculer un ensemble de statistiques. Des échantillons de plus grande taille permettent aux chercheurs de mieux déterminer les valeurs moyennes de leurs données et d'éviter les erreurs en testant un petit nombre d'échantillons potentiellement atypiques.
TL; DR (trop long; n'a pas lu)
La taille de l'échantillon est une considération importante pour la recherche. Des tailles d'échantillon plus grandes fournissent des valeurs moyennes plus précises, identifient les valeurs aberrantes qui pourraient fausser les données dans un échantillon plus petit et fournissent une marge d'erreur plus petite.
Taille de l'échantillon
La taille de l'échantillon est le nombre d'informations testées dans une enquête ou une expérience. Par exemple, si vous testez 100 échantillons d'eau de mer pour les résidus de pétrole, la taille de votre échantillon est de 100. Si vous interrogez 20 000 personnes pour des signes d'anxiété, la taille de votre échantillon est de 20 000. De plus grandes tailles d'échantillons ont l'avantage évident de fournir plus de données pour les chercheurs; mais les expériences sur des échantillons de grande taille nécessitent des engagements financiers et temporels plus importants.
Valeur moyenne et valeurs aberrantes
De plus grandes tailles d'échantillons aident à déterminer la valeur moyenne d'une qualité parmi les échantillons testés - cette moyenne est la moyenne. Plus la taille de l'échantillon est grande, plus la moyenne est précise. Par exemple, si vous trouvez que, parmi 40 personnes, la taille moyenne est de 5 pieds, 4 pouces, mais parmi 100 personnes, la taille moyenne est de 5 pieds, 3 pouces, la deuxième mesure est une meilleure estimation de la taille moyenne d'un individu, puisque vous testez beaucoup plus sujets. La détermination de la moyenne permet également aux chercheurs de repérer plus facilement valeurs aberrantes. Une valeur aberrante est une donnée qui diffère fortement de la valeur moyenne et peut représenter un point d'intérêt pour la recherche. Donc, sur la base de la hauteur moyenne, une personne d'une hauteur de 6 pieds 8 pouces serait un point de données périphérique.
Le danger des petits échantillons
La possibilité de valeurs aberrantes fait partie de ce qui rend la grande taille d'échantillon importante. Par exemple, supposons que vous interrogez 4 personnes sur leur affiliation politique et que l'une d'entre elles appartienne au parti indépendant. Comme il s'agit d'un individu sur un échantillon de 4, votre statistique montrera que 25 % de la population appartient au parti indépendant, ce qui est probablement une extrapolation inexacte. L'augmentation de la taille de votre échantillon évitera des statistiques trompeuses si une valeur aberrante est présente dans votre échantillon.
Marge d'erreur
La taille de l'échantillon est directement liée à une statistique marge d'erreur, ou la précision avec laquelle une statistique peut être calculée. Pour une question par oui ou par non, par exemple si un particulier possède une voiture, vous pouvez déterminer la marge de erreur pour une statistique en divisant 1 par la racine carrée de la taille de l'échantillon et en multipliant par 100. Le total est un pourcentage. Par exemple, une taille d'échantillon de 100 aura une marge d'erreur de 10 pour cent. Lorsque vous mesurez des qualités numériques avec une valeur moyenne, comme la taille ou le poids, multipliez ce total par deux fois le écart-type des données, qui mesure l'écart entre les valeurs des données et la moyenne. Dans les deux cas, plus la taille de l'échantillon est grande, plus la marge d'erreur est petite.