У статистици се Гаусова, или нормална дистрибуција користи за карактеризацију сложених система са многим факторима. Као што је описано у Историји статистике Степхена Стиглера, Абрахам Де Моивре је изумео дистрибуцију која носи име Карла Фредрицка Гаусса. Гаусс-ов допринос лежао је у примени дистрибуције на приступ најмањих квадрата за минимизирање грешке у уклапању података линијом која најбоље одговара. Стога је то учинио најважнијом расподелом грешака у статистици.
Мотивација
Каква је дистрибуција узорка података? Шта ако не знате која је основна дистрибуција података? Постоји ли начин за тестирање хипотеза о подацима без познавања основне дистрибуције? Захваљујући Централној граничној теореми, одговор је да.
Изјава о теореми
У њему се наводи да је узорак средње вредности из бесконачне популације приближно нормалан, или Гаусова средња вредност исто као и основна популација, а варијанса једнака варијанси популације подељене узорком величина. Приближавање се побољшава како величина узорка постаје већа.
Изјава о апроксимацији се понекад погрешно наводи као закључак о конвергенцији у нормалну расподелу. Будући да се приближна нормална дистрибуција мења са повећањем величине узорка, таква изјава обмањује.
Теорему је развио Пиерре Симон Лаплаце.
Зашто је свуда
Уобичајена дистрибуција је свеприсутна. Разлог потиче из централне граничне теореме. Често се када се вредност мери, то је збирни ефекат многих независних променљивих. Стога вредност која се мери сама по себи има просечан квалитет узорка. На пример, расподела перформанси спортиста може имати облик звона, као резултат разлика у исхрани, тренингу, генетици, тренирању и психологији. Чак и висина мушкараца има нормалну расподелу, која је у функцији многих биолошких фактора.
Гауссиан Цопулас
Оно што се назива „функција копуле“ са Гауссовом дистрибуцијом било је у вестима 2009. године због његове употребе у процени ризика од инвестирања у колатерализоване обвезнице. Злоупотреба функције била је кључна у финансијској кризи 2008-2009. Иако је било много узрока кризе, уназад Гаусове расподеле вероватно није требало користити. Функција са дебљим репом доделила би већу вероватноћу нежељеним догађајима.
Извођење
Теорема о централној граници може се доказати у многим редовима анализом функције генерисања тренутка (мгф) (узорка средња вредност - средња вредност популације) /? (варијанса популације / величина узорка) у функцији мгф основне популације. Приближни део теореме уведен је проширивањем мгф основне популације као низа степена, а затим се показује да је већина појмова безначајна како величина узорка постаје већа.
То се може доказати у много мање редова употребом Тејлорове експанзије на карактеристичној једначини исте функције и повећавањем величине узорка.
Рачунарска погодност
Неки статистички модели претпостављају да су грешке Гаусове. Ово омогућава расподелу функција нормалних променљивих, попут хи-квадрата и Ф-расподеле, да се користе у испитивању хипотеза. Конкретно, у Ф-тесту, Ф статистика се састоји од односа дистрибуције хи-квадрата, који су и сами функције нормалног параметра варијансе. Однос ове две чини да се варијанса поништава, омогућавајући тестирање хипотеза без познавања варијанси, осим њихове нормалности и постојаности.