V statistiki se Gaussova ali običajna porazdelitev uporablja za označevanje zapletenih sistemov s številnimi dejavniki. Kot je opisano v Zgodovini statistike Stephena Stiglerja, je Abraham De Moivre izumil distribucijo, ki nosi ime Karla Fredricka Gaussa. Gaussov prispevek je bil v njegovi uporabi razdelitve na pristop najmanjših kvadratov za zmanjšanje napak pri prilagajanju podatkov z vrstico, ki najbolje ustreza. Tako je postavil najpomembnejšo porazdelitev napak v statistiki.
Motivacija
Kakšna je porazdelitev vzorca podatkov? Kaj pa, če ne poznate osnovne distribucije podatkov? Ali lahko kako preveriti hipoteze o podatkih, ne da bi vedeli njihovo distribucijo? Zahvaljujoč osrednjemu teoremu o meji je odgovor pritrdilen.
Izjava o izrek
Navaja, da je vzorčna srednja vrednost iz neskončne populacije približno normalna ali Gaussova srednja vrednost enako kot osnovna populacija in varianca, enaka varianti populacije, deljeni z vzorcem velikost. Približevanje se izboljša, ko se velikost vzorca poveča.
Izjava o približevanju je včasih napačna kot sklep o konvergenci k normalni porazdelitvi. Ker se približna normalna porazdelitev spreminja s povečanjem velikosti vzorca, je takšna trditev zavajajoča.
Izrek je razvil Pierre Simon Laplace.
Zakaj je povsod
Običajne porazdelitve so vseprisotne. Razlog izhaja iz osrednjega teorema o meji. Pogosto je pri merjenju vrednosti vsota učinkov številnih neodvisnih spremenljivk. Zato ima vrednost, ki jo merimo sama, vzorčno srednjo kakovost. Na primer, porazdelitev športnikovih nastopov ima lahko zvonasto obliko, ki je posledica razlik v prehrani, treningu, genetiki, trenerstvu in psihologiji. Tudi moška višina ima normalno porazdelitev, saj je odvisna od številnih bioloških dejavnikov.
Gaussian Copulas
Tako imenovana "funkcija kopule" z Gaussovo distribucijo je bila v novicah leta 2009 zaradi njene uporabe pri ocenjevanju tveganja vlaganja v zavarovane obveznice. Zloraba funkcije je bila ključna za finančno krizo 2008–2009. Vzrokov za krizo je bilo sicer veliko, v zadnjem času pa verjetno ne bi smeli uporabljati Gaussovih porazdelitev. Funkcija z debelejšim repom bi dodelila večjo verjetnost neželenim dogodkom.
Izpeljava
Teorem o srednji meji je mogoče dokazati v številnih vrsticah z analizo funkcije generiranja trenutka (mgf) [vzorca povprečje - povprečje populacije) /? (varianca populacije / velikost vzorca) v odvisnosti od mgf osnovne populacije. Približni del izreka je predstavljen tako, da se mgf osnovne populacije razširi kot potenčna serija, nato pa se pokaže, da je večina izrazov nepomembna, saj se velikost vzorca poveča.
To je mogoče dokazati v veliko manj vrsticah z uporabo Taylorjeve ekspanzije na karakteristični enačbi iste funkcije in povečanjem velikosti vzorca.
Računalniške udobnosti
Nekateri statistični modeli domnevajo, da so napake Gaussove. To omogoča, da se porazdelitve funkcij normalnih spremenljivk, kot sta hi-kvadrat in F-porazdelitev, uporabljajo pri preverjanju hipotez. Natančneje, v F-testu je statistika F sestavljena iz razmerja porazdelitev hi-kvadrat, ki so same po sebi funkcije parametra normalne variance. Razmerje med obema povzroči, da varianca izgine, kar omogoča preverjanje hipotez brez poznavanja varianc, razen njihove normalnosti in stalnosti.