Was ist die Gaußsche Verteilung?

In der Statistik wird die Gauß- oder Normalverteilung verwendet, um komplexe Systeme mit vielen Faktoren zu charakterisieren. Wie in Stephen Stiglers The History of Statistics beschrieben, erfand Abraham De Moivre die Distribution, die den Namen von Karl Fredrick Gauss trägt. Gauß' Beitrag lag in seiner Anwendung der Verteilung auf den Ansatz der kleinsten Quadrate zur Minimierung von Fehlern bei der Anpassung von Daten mit einer Linie der besten Anpassung. Damit machte er sie zur wichtigsten Fehlerverteilung in der Statistik.

Motivation

Wie ist die Verteilung einer Datenstichprobe? Was ist, wenn Sie die zugrunde liegende Verteilung der Daten nicht kennen? Gibt es eine Möglichkeit, Hypothesen über die Daten zu testen, ohne die zugrunde liegende Verteilung zu kennen? Dank des zentralen Grenzwertsatzes lautet die Antwort ja.

Aussage des Theorems

Es besagt, dass ein Stichprobenmittelwert aus einer unendlichen Grundgesamtheit ungefähr normal oder Gaußsch ist, mit Mittelwert gleich der zugrunde liegenden Grundgesamtheit und Varianz gleich der Grundgesamtheitsvarianz geteilt durch die Stichprobe Größe. Die Näherung verbessert sich, wenn die Stichprobengröße größer wird.

instagram story viewer

Die Näherungsaussage wird manchmal als Schlussfolgerung über die Konvergenz zu einer Normalverteilung falsch dargestellt. Da sich die approximierende Normalverteilung mit zunehmender Stichprobengröße ändert, ist eine solche Aussage irreführend.

Der Satz wurde von Pierre Simon Laplace entwickelt.

Warum es überall ist

Normalverteilungen sind allgegenwärtig. Der Grund dafür liegt im zentralen Grenzwertsatz. Wenn ein Wert gemessen wird, ist er oft der Summeneffekt vieler unabhängiger Variablen. Daher hat der gemessene Wert selbst eine Stichproben-Mittelwert-Qualität. Beispielsweise kann die Leistungsverteilung eines Sportlers aufgrund von Unterschieden in Ernährung, Training, Genetik, Coaching und Psychologie glockenförmig sein. Auch die Körpergröße von Männern ist normal verteilt und hängt von vielen biologischen Faktoren ab.

Gaußsche Copulas

Die sogenannte „Copula-Funktion“ mit Gaußscher Verteilung war 2009 in den Nachrichten, da sie zur Risikobewertung von Anlagen in besicherten Anleihen verwendet wird. Der Missbrauch der Funktion war maßgeblich an der Finanzkrise von 2008-2009 beteiligt. Obwohl es viele Ursachen für die Krise gab, hätten im Nachhinein Gaußsche Verteilungen wahrscheinlich nicht verwendet werden dürfen. Eine Funktion mit einem dickeren Schwanz hätte unerwünschten Ereignissen eine höhere Wahrscheinlichkeit zugeordnet.

Ableitung

Der zentrale Grenzwertsatz kann in vielen Zeilen bewiesen werden, indem man die momenterzeugende Funktion (mgf) von (Beispiel Mittelwert - Populationsmittelwert)/?(Populationsvarianz / Stichprobengröße) als Funktion der mgf der zugrunde liegenden Population Der Approximationsteil des Theorems wird eingeführt, indem die mgf der zugrunde liegenden Grundgesamtheit als Potenzreihe erweitert wird, wodurch gezeigt wird, dass die meisten Terme mit zunehmender Stichprobengröße unbedeutend sind.

Es kann in viel weniger Zeilen bewiesen werden, indem man eine Taylor-Entwicklung der charakteristischen Gleichung derselben Funktion verwendet und den Stichprobenumfang groß macht.

Computerkomfort

Einige statistische Modelle gehen von Gaußschen Fehlern aus. Dies ermöglicht die Verwendung von Verteilungen von Funktionen normaler Variablen, wie der Chi-Quadrat- und der F-Verteilung, beim Hypothesentesten. Insbesondere beim F-Test besteht die F-Statistik aus einem Verhältnis von Chi-Quadrat-Verteilungen, die selbst Funktionen eines normalen Varianzparameters sind. Das Verhältnis der beiden bewirkt, dass sich die Varianz aufhebt, was ein Hypothesentesten ohne Kenntnis der Varianzen abgesehen von ihrer Normalität und Konstanz ermöglicht.

Teachs.ru
  • Teilen
instagram viewer