Tilastoissa Gaussin eli normaalia jakaumaa käytetään kuvaamaan monimutkaisia järjestelmiä monilla tekijöillä. Kuten Stephen Stiglerin The History of Statistics kuvaili, Abraham De Moivre keksi Karl Fredrick Gaussin nimeä kantavan jakelun. Gaussin panos oli siinä, että hän sovelsi jakamista pienimpiin neliöihin -lähestymistapaa minimoimaan virheet sovitettaessa tietoja parhaiten sopivalla rivillä. Siksi hän teki siitä tärkeimmän virheenjaon tilastoissa.
Motivaatio
Mikä on datan otoksen jakauma? Entä jos et tiedä tietojen taustalla olevaa jakelua? Onko mitään tapaa testata hypoteeseja tiedoista tietämättä taustalla olevaa jakaumaa? Keskirajalauseen ansiosta vastaus on kyllä.
Lauseen lausunto
Siinä todetaan, että näytteen keskiarvo äärettömästä populaatiosta on suunnilleen normaali tai Gaussin keskiarvo sama kuin taustalla oleva populaatio, ja varianssi, joka on yhtä suuri kuin populaation varianssi jaettuna otoksella koko. Arviointi paranee otoksen koon kasvaessa.
Lähentämislauseke on joskus väärä johtopäätöksenä lähentymisestä normaalijakaumaan. Koska likimääräinen normaalijakauma muuttuu otoksen koon kasvaessa, tällainen lausuma on harhaanjohtava.
Lauseen kehitti Pierre Simon Laplace.
Miksi se on kaikkialla
Normaalit jakaumat ovat läsnä. Syy tulee Central Limit Theoremista. Usein kun arvo mitataan, se on monien riippumattomien muuttujien summafekti. Siksi itse mitattavalla arvolla on näyte-keskiarvo. Esimerkiksi urheilijan suoritusten jakaumalla voi olla kellomuoto ruokavalion, harjoittelun, genetiikan, valmennuksen ja psykologian erojen seurauksena. Jopa miesten korkeuksilla on normaali jakauma, joka riippuu monista biologisista tekijöistä.
Gaussin kopulat
Niin kutsuttu kopulafunktio, jolla on Gaussin jakauma, oli uutisissa vuonna 2009, koska sitä käytettiin arvioitaessa vakuudellisiin joukkolainoihin sijoittamisen riskiä. Toiminnon väärinkäyttö oli ratkaisevaa finanssikriisissä vuosina 2008–2009. Vaikka kriisillä oli monia syitä, jälkikäteen Gaussin jakaumia ei todennäköisesti olisi pitänyt käyttää. Paksumman hännän toiminto olisi antanut suuremman todennäköisyyden haittatapahtumille.
Johtaminen
Keskirajalause voidaan todistaa monella rivillä analysoimalla (näytteen) hetken generoiva funktio (mgf) keskiarvo - populaation keskiarvo) /? (populaation varianssi / otoksen koko) perustana olevan populaation mgf: n funktiona. Lauseen approksimaatio-osa otetaan käyttöön laajentamalla taustalla olevan väestön mgf tehosarjana, jolloin useimpien termien näyttäminen on merkityksetöntä, kun otoksen koko kasvaa.
Se voidaan todistaa huomattavasti vähemmän riveillä käyttämällä Taylor-laajennusta saman funktion tunnusomaisessa yhtälössä ja tekemällä otoskoko suureksi.
Laskennallinen mukavuus
Joissakin tilastomalleissa oletetaan virheiden olevan Gaussin. Tämä mahdollistaa normaalimuuttujien funktioiden jakautumisten, kuten khi-neliö- ja F-jakauman, käytön hypoteesitestauksessa. Tarkemmin sanottuna F-testissä F-statistiikka koostuu khi-neliöjakaumien suhteesta, jotka itse ovat normaalin varianssiparametrin funktioita. Näiden kahden suhde saa varianssin perumaan, mikä mahdollistaa hypoteesitestauksen tietämättä variansseja niiden normaalisuuden ja pysyvyyden lisäksi.