Что такое гауссово распределение?

В статистике гауссово, или нормальное, распределение используется для характеристики сложных систем с множеством факторов. Как описано в книге Стивена Стиглера «История статистики», Абрахам де Муавр изобрел дистрибутив, который носит имя Карла Фредрика Гаусса. Вклад Гаусса заключался в его применении распределения к подходу наименьших квадратов для минимизации ошибки при аппроксимации данных линией наилучшего соответствия. Таким образом, он сделал это наиболее важным распределением ошибок в статистике.

Мотивация

Каково распределение выборки данных? Что делать, если вы не знаете, каково распределение данных? Есть ли способ проверить гипотезы о данных, не зная основного распределения? Благодаря Центральной предельной теореме ответ - да.

Формулировка теоремы.

В нем говорится, что выборочное среднее из бесконечной совокупности приблизительно нормальное, или гауссовское, со средним то же, что и основная совокупность, а дисперсия равна дисперсии генеральной совокупности, деленной на выборку размер. Приближение улучшается по мере увеличения размера выборки.

instagram story viewer

Заявление о приближении иногда ошибочно принимают за вывод о сходимости к нормальному распределению. Поскольку аппроксимирующее нормальное распределение изменяется с увеличением размера выборки, такое утверждение вводит в заблуждение.

Теорема была разработана Пьером Симоном Лапласом.

Почему это везде

Нормальные распределения вездесущи. Причина кроется в Центральной предельной теореме. Часто, когда значение измеряется, это совокупный эффект многих независимых переменных. Следовательно, само измеряемое значение имеет качество выборочного среднего. Например, распределение результатов спортсменов может иметь форму колокола в результате различий в диете, тренировках, генетике, тренерской работе и психологии. Даже рост мужчин имеет нормальное распределение, являющееся функцией многих биологических факторов.

Гауссовские копулы

То, что называется «функцией копулы» с распределением Гаусса, было в новостях в 2009 году из-за ее использования при оценке риска инвестирования в обеспеченные облигации. Неправильное использование функции сыграло важную роль в финансовом кризисе 2008-2009 годов. Хотя причин кризиса было много, в ретроспективе гауссовские распределения, вероятно, не следовало использовать. Функция с более толстым хвостом привела бы к большей вероятности нежелательных явлений.

Вывод

Центральную предельную теорему можно доказать во многих строках, анализируя производящую функцию момента (mgf) для (sample среднее - среднее значение генеральной совокупности) /? (дисперсия совокупности / размер выборки) как функция MGF основной совокупности. Аппроксимационная часть теоремы вводится путем расширения MGF основной совокупности в виде степенного ряда, а затем показа, что большинство членов не имеют значения по мере увеличения размера выборки.

Это можно доказать на гораздо меньшем количестве строк, используя разложение Тейлора характеристического уравнения той же функции и увеличивая размер выборки.

Вычислительное удобство

Некоторые статистические модели предполагают, что ошибки являются гауссовыми. Это позволяет использовать распределения функций нормальных переменных, такие как хи-квадрат и F-распределение, при проверке гипотез. В частности, в F-тесте F-статистика состоит из отношения распределений хи-квадрат, которые сами по себе являются функциями нормального параметра дисперсии. Отношение этих двух факторов приводит к тому, что дисперсия сокращается, что позволяет проверять гипотезы без знания дисперсий, кроме их нормальности и постоянства.

Teachs.ru
  • Доля
instagram viewer