La statistique consiste à tirer des conclusions face à l'incertitude. Chaque fois que vous prélevez un échantillon, vous ne pouvez pas être complètement certain que votre échantillon reflète vraiment la population dont il est tiré. Les statisticiens traitent cette incertitude en prenant en compte les facteurs qui pourraient impacter l'estimation, quantifier leur incertitude et effectuer des tests statistiques pour tirer des conclusions de ces données incertaines.
Les statisticiens utilisent des intervalles de confiance pour spécifier une plage de valeurs susceptible de contenir le « vrai » moyenne de la population sur la base d'un échantillon, et expriment leur niveau de certitude à ce sujet par la confiance les niveaux. Bien que le calcul des niveaux de confiance ne soit pas souvent utile, le calcul des intervalles de confiance pour un niveau de confiance donné est une compétence très utile.
TL; DR (trop long; n'a pas lu)
Calculer un intervalle de confiance pour un niveau de confiance donné en multipliant l'erreur type par le
Zscore pour le niveau de confiance que vous avez choisi. Soustrayez ce résultat de la moyenne de votre échantillon pour obtenir la limite inférieure et ajoutez-le à la moyenne de l'échantillon pour trouver la limite supérieure. (Voir Ressources)Répétez le même processus mais avec letscore à la place duZscore pour les petits échantillons (m < 30).
Trouvez un niveau de confiance pour un ensemble de données en prenant la moitié de la taille de l'intervalle de confiance, en le multipliant par la racine carrée de la taille de l'échantillon, puis en divisant par l'écart type de l'échantillon. Rechercher le résultatZou alorstscore dans un tableau pour trouver le niveau.
La différence entre le niveau de confiance et Intervalle de confiance
Lorsque vous voyez une statistique citée, il y a parfois une plage donnée après elle, avec l'abréviation « CI » (pour « intervalle de confiance ») ou simplement un symbole plus-moins suivi d'un chiffre. Par exemple, « le poids moyen d'un homme adulte est de 180 livres (IC: 178,14 à 181,86) » ou « le poids moyen d'un homme adulte est de 180 ± 1,86 livres sterling." Ceux-ci vous disent tous les deux la même information: sur la base de l'échantillon utilisé, le poids moyen d'un homme se situe probablement dans un certain intervalle. La plage elle-même est appelée intervalle de confiance.
Si vous voulez être aussi sûr que possible que la plage contient la vraie valeur, vous pouvez élargir la plage. Cela augmenterait votre « niveau de confiance » dans l'estimation, mais la plage couvrirait plus de poids potentiels. La plupart des statistiques (y compris celle citée ci-dessus) sont données sous forme d'intervalles de confiance à 95 %, ce qui signifie qu'il y a 95 % de chances que la vraie valeur moyenne se situe dans la plage. Vous pouvez également utiliser un niveau de confiance de 99 % ou un niveau de confiance de 90 %, selon vos besoins.
Calcul des intervalles ou des niveaux de confiance pour de grands échantillons
Lorsque vous utilisez un niveau de confiance dans les statistiques, vous en avez généralement besoin pour calculer un intervalle de confiance. C'est un peu plus facile à faire si vous avez un grand échantillon, par exemple, plus de 30 personnes, car vous pouvez utiliserZscore pour votre estimation plutôt que plus compliquétscores.
Prenez vos données brutes et calculez la moyenne de l'échantillon (additionnez simplement les résultats individuels et divisez par le nombre de résultats). Calculez l'écart type en soustrayant la moyenne de chaque résultat individuel pour trouver la différence, puis placez cette différence au carré. Additionnez toutes ces différences, puis divisez le résultat par la taille de l'échantillon moins 1. Prenez la racine carrée de ce résultat pour trouver l'écart type de l'échantillon (voir Ressources).
Déterminez l'intervalle de confiance en trouvant d'abord l'erreur standard :
SE=\frac{s}{\sqrt{n}}
Oùsest l'écart type de votre échantillon etmest la taille de votre échantillon. Par exemple, si vous prenez un échantillon de 1 000 hommes pour calculer le poids moyen d'un homme et obtenez un échantillon d'écart type de 30, cela donnerait :
SE=\frac{30}{\sqrt{1000}}=0.95
Pour trouver l'intervalle de confiance à partir de cela, recherchez le niveau de confiance pour lequel vous souhaitez calculer l'intervalle dans unZ-tableau des scores et multipliez cette valeur par leZBut. Pour un niveau de confiance de 95 %, leZ-score est de 1,96. En utilisant l'exemple, cela signifie :
\text{mean }\pm Z\times SE=180\text{ livres }\pm1.96\times 0.95=180\pm1.86\text{ livres}
Ici, ± 1,86 livre est l'intervalle de confiance à 95 %.
Si vous disposez de cette information à la place, ainsi que de la taille de l'échantillon et de l'écart type, vous pouvez calculer le niveau de confiance en utilisant la formule suivante :
Z=0,5\times{ taille de l'intervalle de confiance }\times\frac{\sqrt{n}}{s}
La taille de l'intervalle de confiance est juste le double de la valeur ±, donc dans l'exemple ci-dessus, nous savons que 0,5 fois c'est 1,86. Cela donne:
Z=1.86\times\frac{\sqrt{1000}}{30}=1.96
Cela nous donne une valeur pourZ, que vous pouvez consulter dans unZ-tableau des scores pour trouver le niveau de confiance correspondant.
Calcul des intervalles de confiance pour de petits échantillons
Pour les petits échantillons, il existe un processus similaire pour calculer l'intervalle de confiance. Tout d'abord, soustrayez 1 de la taille de votre échantillon pour trouver vos « degrés de liberté ». En symboles :
df=n-1
Pour un échantillonm= 10, cela donnedf = 9.
Trouvez votre valeur alpha en soustrayant la version décimale du niveau de confiance (c'est-à-dire votre niveau de confiance en pourcentage divisé par 100) de 1 et en divisant le résultat par 2, ou en symboles :
\alpha=\frac{(1-\text{ niveau de confiance décimal})}{2}
Donc, pour un niveau de confiance de 95 % (0,95) :
\alpha=\frac{(1-0,95)}{2}=0,025
Recherchez votre valeur alpha et vos degrés de liberté dans un (une queue)ttableau de répartition et notez le résultat. Alternativement, omettez la division par 2 ci-dessus et utilisez un à deux queuestvaleur. Dans cet exemple, le résultat est 2,262.
Comme à l'étape précédente, calculez l'intervalle de confiance en multipliant ce nombre par l'erreur standard, qui est déterminée en utilisant l'écart type de votre échantillon et la taille de l'échantillon de la même manière. La seule différence est qu'à la place duZscore, vous utilisez letBut.