Какво е Гаусово разпределение?

В статистиката гауссовото или нормалното разпределение се използва за характеризиране на сложни системи с много фактори. Както е описано в „Историята на статистиката“ на Стивън Стиглер, Абрахам Де Мойвр е изобретил разпространението, което носи името на Карл Фредрик Гаус. Приносът на Гаус е в прилагането му на подхода на най-малките квадрати за минимизиране на грешките при напасването на данните с най-подходяща линия. По този начин той го направи най-важното разпределение на грешки в статистиката.

Мотивация

Какво е разпределението на извадка от данни? Какво ще стане, ако не знаете основното разпространение на данните? Има ли начин да се тестват хипотези относно данните, без да се знае основното разпространение? Благодарение на централната гранична теорема отговорът е да.

Изложение на теоремата

Той гласи, че извадка средно от безкрайна популация е приблизително нормална, или Гаусова, със средна стойност същата като основната популация и дисперсия, равна на дисперсията на популацията, разделена на извадката размер. Апроксимацията се подобрява, тъй като размерът на извадката става голям.

instagram story viewer

Изявлението за сближаване понякога се заблуждава като заключение за сближаване към нормално разпределение. Тъй като приблизителното нормално разпределение се променя с увеличаване на размера на извадката, такова твърдение е подвеждащо.

Теоремата е разработена от Пиер Симон Лаплас.

Защо е навсякъде

Нормалните разпределения са вездесъщи. Причината идва от централната гранична теорема. Често, когато се измерва стойност, това е ефектът от сумата на много независими променливи. Следователно стойността, която се измерва, има средно качество на пробата. Например разпределението на представленията на спортистите може да има форма на камбана в резултат на различия в диетата, обучението, генетиката, треньорството и психологията. Дори височината на мъжете има нормално разпределение, тъй като е функция на много биологични фактори.

Гаусови копули

Това, което се нарича „функция на копула“ с гаусова дистрибуция, беше в новините през 2009 г. поради използването му при оценка на риска от инвестиране в обезпечени облигации. Злоупотребата с функцията е допринесла за финансовата криза от 2008-2009 г. Въпреки че имаше много причини за кризата, отзад нататък гауссовите разпределения вероятно не трябваше да се използват. Функция с по-дебела опашка би определила по-голяма вероятност за нежелани събития.

Деривация

Теоремата за централната граница може да бъде доказана в много редове чрез анализ на функцията за генериране на момента (mgf) на (проба средна стойност - средна популация) /? (вариация на популацията / размер на извадката) като функция от mgf на основната популация. Приблизителната част на теоремата е въведена чрез разширяване на mgf на основната популация като степенна серия, след което се показва, че повечето термини са незначителни, тъй като размерът на извадката става голям.

Това може да бъде доказано в много по-малко редове, като се използва разширение на Тейлър върху характеристичното уравнение на същата функция и се увеличи размерът на извадката.

Изчислително удобство

Някои статистически модели предполагат, че грешките са гауссови. Това позволява разпределенията на функции на нормални променливи, като хи-квадрат и F-разпределение, да се използват при тестване на хипотези. По-конкретно, в F-теста F статистиката се състои от съотношение на разпределения хи-квадрат, които сами по себе си са функции на параметър на нормална дисперсия. Съотношението на двете води до отмяна на дисперсията, което позволява тестване на хипотези, без да се знаят дисперсиите, освен тяхната нормалност и постоянство.

Teachs.ru
  • Дял
instagram viewer