So berechnen Sie die Fehlerspanne

Error. Schon das Wort schwingt mit Bedauern und Reue mit, zumindest wenn Sie zufällig Baseballspieler, Prüfungsteilnehmer oder Quizshow-Teilnehmer sind. Für Statistiker sind Fehler einfach eine weitere Sache, die es im Rahmen der Stellenbeschreibung zu beachten gilt – es sei denn, es geht um eigene Fehler des Statistikers.

Der BegriffFehlermargeist in der Alltagssprache üblich, darunter viele Medienartikel zu wissenschaftlichen Themen oder Meinungsumfragen. Es ist eine Möglichkeit, die Zuverlässigkeit eines Wertes anzugeben (z. B. der Prozentsatz der Erwachsenen, die einen bestimmten politischen Kandidaten bevorzugen). Er basiert auf einer Reihe von Faktoren, einschließlich der Größe der gezogenen Stichprobe und dem angenommenen Wert des Grundgesamtheitsmittels der interessierenden Variablen.

Um die Fehlerspanne zu verstehen, müssen Sie zunächst über grundlegende Kenntnisse der Statistik, insbesondere des Konzepts einer Normalverteilung, verfügen. Achten Sie beim Lesen besonders auf den Unterschied zwischen dem Mittelwert einer Stichprobe und dem Mittelwert einer großen Anzahl dieser Stichprobenmittelwerte.

instagram story viewer

Bevölkerungsstatistik: Die Grundlagen

Wenn Sie eine Stichprobe von Daten haben, wie die Gewichte von 500 zufällig ausgewählten 15-jährigen Jungen in Schweden, können Sie Berechnen Sie den Mittelwert oder Durchschnitt, indem Sie die Summe der einzelnen Gewichte durch die Anzahl der Datenpunkte dividieren (500). Die Standardabweichung dieser Stichprobe ist ein Maß für die Streuung dieser Daten um diesen Mittelwert und zeigt, wie stark Werte (z. B. Gewichtungen) zu Clustern neigen.

  • Was hat höchstwahrscheinlich eine größere Standardabweichung: Das Durchschnittsgewicht der oben genannten schwedischen Jungen in Pfund oder die Gesamtschuljahre, die sie im Alter von 15 Jahren abgeschlossen haben?

DasZentraler Grenzwertsatzder Statistik besagt, dass in jeder Stichprobe aus einer Grundgesamtheit mit einem Wert für eine gegebene Variable, der normal um einen Mittelwert verteilt ist, dann der Durchschnittvon den Mitteln​ ​von Probenaus dieser Grundgesamtheit entnommen wird, nähert sich dem Grundgesamtheitsmittelwert, wenn die Anzahl der Stichprobenmittelwerte in Richtung unendlich wächst.

In der Stichprobenstatistik werden der Mittelwert und die Standardabweichung durch x̄ und s dargestellt, die echte Statistiken sind, und nichtμund σ, die eigentlich sindParameterund kann nicht mit 100-prozentiger Sicherheit bekannt sein. Das folgende Beispiel veranschaulicht den Unterschied, der bei der Berechnung der Fehlermargen zum Tragen kommt.

Wenn Sie wiederholt die Körpergröße von 100 zufällig ausgewählten Frauen in einem großen Land, in dem die durchschnittliche Körpergröße einer erwachsenen Frau 64,25 Zoll beträgt, mit a Standardabweichung von 2 Zoll, können Sie aufeinanderfolgende x̄-Werte von 63,7, 64,9, 64,5 usw. sammeln, mit Standardabweichungen s von 1,7, 2,3, 2,2 Zoll und der mögen. In jedem Fall,μ undσ bleiben unverändert bei 64,25 bzw. 2 Zoll.

\text{Mittelwert der Bevölkerung } = \mu \newline \text{Standardabweichung der Bevölkerung }= \sigma \newline \text{Bevölkerungsvarianz}= \sigma^2 \newline \text{Stichprobenmittelwert}= \bar{x} \newline \text{Stichprobenstandardabweichung }= s\newline \text{Stichprobenvarianz }= s^2

Was ist ein Konfidenzintervall?

Wenn Sie eine einzelne Person zufällig auswählen und ihr ein allgemeines Wissenschaftsquiz mit 20 Fragen geben würden, wäre es töricht, das Ergebnis als Durchschnitt für eine größere Gruppe von Testteilnehmern zu verwenden. Wenn jedoch der Durchschnittswert der Bevölkerung für dieses Quiz bekannt ist, kann die Macht der Statistik genutzt werden, um Bestimmen Sie die Gewissheit, dass eine Reihe von Werten (in diesem Fall Punktzahlen) die Werte dieser einzelnen Person enthalten wird Ergebnis.

EINKonfidenzintervallist ein Wertebereich, der dem erwarteten Prozentsatz solcher Intervalle entspricht, die den Wert enthalten werden wenn eine große Anzahl solcher Intervalle zufällig erstellt wird, unter Verwendung der gleichen Stichprobengrößen aus dem gleichen größeren Population. Es gibt immeretwasunsicher darüber, ob ein bestimmtes Konfidenzintervall von weniger als 100 Prozent tatsächlich den wahren Wert des Parameters enthält; meistens wird ein Konfidenzintervall von 95 Prozent verwendet.

Beispiel: Angenommen, Ihr Quiz-Teilnehmer hat eine Punktzahl von 22/25 (88 Prozent) erreicht und der Durchschnittswert der Bevölkerung beträgt 53 Prozent mit einer Standardabweichung von ± 10 Prozent. Gibt es eine Möglichkeit zu wissen, ob sich diese Punktzahl auf den Mittelwert in Perzentilen bezieht und wie hoch die Fehlerspanne ist?

Was sind kritische Werte?

Kritische Werte basieren auf normalverteilten Daten, die hier bisher besprochen wurden. Dabei handelt es sich um Daten, die symmetrisch um einen zentralen Mittelwert verteilt sind, wie beispielsweise Größe und Gewicht in der Regel. Andere Populationsvariablen wie das Alter zeigen keine Normalverteilungen.

Kritische Werte werden verwendet, um Konfidenzintervalle zu bestimmen. Diese basieren auf dem Prinzip, dass Populationsmittelwerte eigentlich sehr, sehr zuverlässige Schätzungen sind, die aus einer praktisch unbegrenzten Anzahl von Stichproben zusammengewürfelt werden. Sie werden bezeichnet mitz, und Sie benötigen ein Diagramm wie das in den Ressourcen, um mit ihnen zu arbeiten, da Ihr gewähltes Konfidenzintervall ihren Wert bestimmt.

Ein Grund, den Sie brauchenz-Werte (oderz-Scores) soll die Fehlerspanne eines Stichprobenmittelwerts oder eines Grundgesamtheitsmittelwerts bestimmen. Diese Berechnungen werden auf etwas andere Weise gehandhabt.

Standardfehler vs. Standardabweichung

Die Standardabweichung einer Probe s ist für jede Probe unterschiedlich; der Standardfehler des Mittelwertes einer Anzahl von Stichproben hängt von der Standardabweichung der Grundgesamtheit σ ab und wird durch den Ausdruck angegeben:

\text{Standardfehler} = \dfrac{\sigma}{\sqrt{n}} \newline

Rand der Fehlerformel

Um die obige Diskussion über Z-Scores fortzusetzen, werden sie aus dem gewählten Konfidenzintervall abgeleitet. Um die zugehörige Tabelle zu verwenden, wandeln Sie den Prozentsatz des Konfidenzintervalls in eine Dezimalzahl um und subtrahieren Sie diesen Menge von 1.0, und dividiere das Ergebnis durch zwei (da das Vertrauensintervall symmetrisch um die bedeuten).

Die Größe (1 − CI), wobei CI das in Dezimalschreibweise ausgedrückte Konfidenzintervall ist, heißtSignifikanzniveauund wird mit α bezeichnet. Wenn beispielsweise KI = 95 % = 0,95 ist,α​ = 1.0 − 0.05 = 0.05.

Sobald Sie diesen Wert haben, finden Sie heraus, wo er in der Z-Score-Tabelle angezeigt wird, und bestimmen Sie diez-score, indem Sie die Werte für die entsprechende Zeile und Spalte notieren. Zum Beispiel, wennα= 0,05, Sie beziehen sich auf den Wert 0,05/2 = 0,025 in der Tabelle, genanntZ(α/2), sehen Sie, dass es mit a. verbunden istz-Score von -1,9 (der Zeilenwert) minus 0,06 (der Spaltenwert), um a. zu erhaltenz-Score von -1,96.

Fehlerspannenberechnungen

Jetzt können Sie einige Fehlerberechnungen durchführen. Wie bereits erwähnt, werden diese unterschiedlich ausgeführt, je nachdem, was genau Sie die Fehlerquote finden.

Die Formel für die Fehlerspanne für einen Stichprobenmittelwert lautet:

E = Z_{(α/2)} × s

und dass für die Fehlerspanne eines Populationsmittelwertes:

E = Z_{(α/2)} × \frac{σ}{\sqrt{n}} = Z_{(α/2)} × \text{Standardfehler}

Beispiel: Angenommen, Sie wissen, dass die Anzahl der Online-Shows in Ihrer Stadt Binge-Watch pro Jahr normal verteilt ist mit einer Bevölkerungsstandardabweichung σ von 3,2 Shows. Es wurde eine Zufallsstichprobe von 29 Stadtbewohnern gezogen, der Stichprobenmittelwert beträgt 14,6 Shows/Jahr. Wie hoch ist die Fehlerspanne bei einem Konfidenzintervall von 90 %?

Sie sehen, dass Sie die zweite der beiden obigen Gleichungen verwenden werden, um dieses Problem zu lösen, da σ gegeben ist. Berechnen Sie zunächst den Standardfehler σ/√n:

\frac{3.6}{\sqrt{29}}= 0.67

Jetzt verwenden Sie den Wert vonZ(α/2) zumα= 0.10. Wenn Sie den Wert 0,050 in der Tabelle finden, sehen Sie, dass dies einem Wert von entsprichtzzwischen −1,64 und −1,65, Sie können also −1,645 verwenden. Für die FehlerquoteE, das gibt:

E = (−1,645)(0,67) = −1,10

Beachten Sie, dass Sie mit dem Positiven hätten beginnen könnenz-Score-Seite der Tabelle und fand den Wert entsprechend 0,90 statt 0,10, da dies den entsprechenden kritischen Punkt auf der gegenüberliegenden (rechten) Seite des Diagramms darstellt. Das hätte gegebenE= 1,10, was sinnvoll ist, da der Fehler auf jeder Seite des Mittelwerts gleich ist.

Zusammengefasst beträgt die Anzahl der Shows, die von der Stichprobe von 29 Ihrer Nachbarn pro Jahr besucht werden, 14,6 ± 1,10 Shows pro Jahr.

Teachs.ru
  • Teilen
instagram viewer