Comment calculer la marge d'erreur

Erreur. Le mot même résonne avec regret et remords, du moins si vous êtes un joueur de baseball, un candidat à un examen ou un participant à un quiz. Pour les statisticiens, les erreurs sont simplement une chose de plus à suivre dans le cadre de la description de poste - à moins, bien sûr, que les propres erreurs du statisticien soient en cause.

Le termemarge d'erreurest courant dans le langage de tous les jours, y compris de nombreux articles de presse sur des sujets scientifiques ou des sondages d'opinion. C'est un moyen de rendre compte de la fiabilité d'une valeur (comme le pourcentage d'adultes favorables à un candidat politique particulier). Elle est basée sur un certain nombre de facteurs, dont la taille de l'échantillon prélevé et la valeur présumée de la moyenne de population de la variable d'intérêt.

Pour comprendre la marge d'erreur, vous devez d'abord avoir une connaissance pratique des statistiques de base, en particulier le concept de distribution normale. Pendant que vous lisez, faites particulièrement attention à la différence entre la moyenne d'un échantillon et la moyenne d'un grand nombre de ces moyennes d'échantillon.

instagram story viewer

Statistiques démographiques: les bases

Si vous disposez d'un échantillon de données, comme les poids de 500 garçons de 15 ans choisis au hasard en Suède, vous pouvez calculer la moyenne, ou la moyenne, en divisant la somme des poids individuels par le nombre de points de données (500). L'écart type de cet échantillon est une mesure de la répartition de ces données par rapport à cette moyenne, montrant à quel point les valeurs (telles que les poids) ont tendance à se regrouper.

  • Qu'est-ce qui a le plus probablement un écart-type le plus important: le poids moyen en livres des garçons suédois susmentionnés, ou le nombre total d'années d'études qu'ils ont achevées à 15 ans ?

leThéorème central limitedes statistiques indique que dans tout échantillon prélevé dans une population avec une valeur pour une variable donnée qui est normalement distribuée autour d'une moyenne, alors la moyennedes moyens​ ​d'échantillonstiré de cette population approchera de la moyenne de la population à mesure que le nombre de moyennes des échantillons croît vers l'infini.

Dans les statistiques d'échantillon, la moyenne et l'écart type sont représentés par x̄ et s, qui sont de vraies statistiques, plutôt que parμet, qui sont en faitparamètreset ne peut pas être connu avec une certitude à 100 pour cent. L'exemple suivant illustre la différence, qui entre en jeu lors du calcul des marges d'erreur.

Si vous avez échantillonné à plusieurs reprises la taille de 100 femmes sélectionnées au hasard dans un grand pays où la taille moyenne d'une femme adulte est de 64,25 pouces, avec un écart type de 2 pouces, vous pouvez collecter des valeurs x̄ successives de 63,7, 64,9, 64,5 et ainsi de suite, avec des écarts types s de 1,7, 2,3, 2,2 pouces et le aimer. Dans chaque cas,etσ restent inchangés à 64,25 et 2 pouces respectivement.

\text{Moyenne de la population } = \mu \newline \text{Ecart type de la population }= \sigma \newline \text{Variation de la population}= \sigma^2 \newline \text{Exemple de moyenne}= \bar{x} \newline \text{Exemple d'écart type }= s\newline \text{Exemple de variance }= s^2

Qu'est-ce qu'un intervalle de confiance ?

Si vous choisissiez une seule personne au hasard et que vous lui proposiez un quiz scientifique général de 20 questions, il serait insensé d'utiliser le résultat comme moyenne pour une population plus importante de candidats. Cependant, si le score moyen de la population pour ce quiz est connu, alors la puissance des statistiques peut être utilisée pour déterminer la confiance que vous pouvez avoir qu'une plage de valeurs (dans ce cas les scores) contiendra les résultats de cette personne But.

UNEIntervalle de confianceest une plage de valeurs qui correspond au pourcentage attendu de tels intervalles qui contiendra la valeur si un grand nombre de ces intervalles est créé de manière aléatoire, en utilisant les mêmes tailles d'échantillon à partir du même plus grand population. Il y a toujoursquelquel'incertitude quant à savoir si un intervalle de confiance particulier inférieur à 100 % contient réellement la vraie valeur du paramètre; la plupart du temps, un intervalle de confiance de 95 % est utilisé.

Exemple: supposons que votre participant au quiz a obtenu un score de 22/25 (88 %) et que le score moyen de la population est de 53 % avec un écart type de ± 10 %. Existe-t-il un moyen de savoir que ce score est lié à la moyenne en termes de centiles et quelle est la marge d'erreur impliquée ?

Quelles sont les valeurs critiques ?

Les valeurs critiques sont basées sur des données normalement distribuées, qui sont le genre qui a été discuté ici jusqu'à présent. Ce sont des données qui sont distribuées symétriquement autour d'une moyenne centrale, comme la taille et le poids ont tendance à l'être. D'autres variables de population, telles que l'âge, ne présentent pas de distributions normales.

Les valeurs critiques sont utilisées pour déterminer les intervalles de confiance. Celles-ci sont basées sur le principe que les moyennes de population sont en fait des estimations très, très fiables assemblées à partir d'un nombre pratiquement illimité d'échantillons. Ils sont désignés parz, et vous avez besoin d'un graphique comme celui des ressources pour les utiliser, car l'intervalle de confiance que vous avez choisi détermine leur valeur.

Une raison pour laquelle vous avez besoinz-valeurs (ouz-scores) consiste à déterminer la marge d'erreur d'une moyenne d'échantillon ou d'une moyenne de population. Ces calculs sont traités de manières quelque peu différentes.

Erreur standard vs. Écart-type

L'écart type d'un échantillon s diffère pour chaque échantillon; l'erreur type de la moyenne d'un nombre d'échantillons dépend de l'écart type de la population et est donnée par l'expression :

\text{Erreur standard} = \dfrac{\sigma}{\sqrt{n}} \newline

Formule de marge d'erreur

Pour poursuivre la discussion ci-dessus sur les scores z, ils sont dérivés de l'intervalle de confiance choisi. Pour utiliser la table associée, convertissez le pourcentage d'intervalle de confiance en un nombre décimal, soustrayez-le quantité à partir de 1,0, et divisez le résultat par deux (car l'intervalle de confiance est symétrique par rapport au moyenne).

La quantité (1 − CI), où CI est l'intervalle de confiance exprimé en notation décimale, est appelée laniveau de significationet est noté. Par exemple, lorsque IC = 95 % = 0,95,α​ = 1.0 − 0.05 = 0.05.

Une fois que vous avez cette valeur, vous trouvez où apparaît sur le tableau des scores z et déterminez lez-score en notant les valeurs de la ligne et de la colonne pertinentes. Par exemple, lorsqueα= 0,05, vous vous référez à la valeur 0,05/2 = 0,025 sur la table, appeléeZ(α/2), voir qu'il est associé à unz-score de -1,9 (la valeur de la ligne) moins un autre 0,06 (la valeur de la colonne) pour donner unz-score de -1,96.

Calculs de marge d'erreur

Vous êtes maintenant prêt à effectuer des calculs de marge d'erreur. Comme indiqué, ceux-ci sont effectués différemment en fonction de ce que vous trouvez exactement de la marge d'erreur.

La formule de la marge d'erreur pour une moyenne d'échantillon est :

E = Z_{(α/2)} × s

et que pour la marge d'erreur d'une population, la moyenne est :

E = Z_{(α/2)} × \frac{σ}{\sqrt{n}} = Z_{(α/2)} × \text{erreur standard}

Exemple: Supposons que vous sachiez que le nombre d'émissions en ligne que les personnes de votre ville regardent en rafale par an est normalement distribué avec un écart type de population σ de 3,2 émissions. Un échantillon aléatoire de 29 citadins a été prélevé et la moyenne de l'échantillon est de 14,6 spectacles/an. En utilisant un intervalle de confiance à 90 %, quelle est la marge d'erreur ?

Vous voyez que vous utiliserez la seconde des deux équations ci-dessus pour résoudre ce problème, puisque est donné. Tout d'abord, calculez l'erreur standard σ/√n :

\frac{3.6}{\sqrt{29}}= 0.67

Maintenant, vous utilisez la valeur deZ(α/2) pourα= 0.10. En repérant la valeur 0,050 sur le tableau, vous voyez que cela correspond à une valeur dezentre -1,64 et -1,65, vous pouvez donc utiliser -1,645. Pour la marge d'erreurE, cela donne:

E = (-1,645) (0,67) = -1,10

Notez que vous auriez pu commencer sur le positifz-score côté du tableau et trouvé la valeur correspondant à 0,90 au lieu de 0,10, car cela représente le point critique correspondant sur le côté opposé (droit) du graphique. Cela aurait donnéE= 1,10, ce qui est logique puisque l'erreur est la même de chaque côté de la moyenne.

En résumé, donc, le nombre de spectacles binged par an par l'échantillon de 29 de vos voisins est de 14,6 ± 1,10 spectacles par an.

Teachs.ru
  • Partager
instagram viewer