A statisztikákban a Gauss-féle vagy normális eloszlást használják a komplex rendszerek sok tényezővel történő jellemzésére. Ahogy Stephen Stigler A statisztika története című művében leírják, Abraham De Moivre feltalálta azt a disztribúciót, amely Karl Fredrick Gauss nevét viseli. Gauss hozzájárulása abban rejlett, hogy a legkisebb négyzetekre osztott megközelítést alkalmazta, hogy minimalizálja a hibákat, amikor az adatokat a legjobban illeszkedő sorba illesztik. Így tette a statisztikák legfontosabb hibamegosztásává.
Motiváció
Mi az adatminta eloszlása? Mi van, ha nem ismeri az adatok mögöttes terjesztését? Van-e mód az adatok hipotéziseinek tesztelésére anélkül, hogy tudnánk az alapul szolgáló eloszlást? A Central Limit tételnek köszönhetően a válasz igen.
A tétel állítása
Azt állítja, hogy a végtelen populációból származó mintaátlag megközelítőleg normális, vagy Gauss-féle, átlaggal megegyezik az alapul szolgáló populációval, és a variancia megegyezik a populáció varianciájával osztva a mintával méret. A közelítés javul, mivel a minta nagysága megnő.
A közelítő állítást néha tévesnek tekintik a normális eloszláshoz való konvergenciára vonatkozó következtetésként. Mivel a megközelítő normál eloszlás a minta méretének növekedésével változik, egy ilyen állítás félrevezető.
A tételt Pierre Simon Laplace dolgozta ki.
Miért van ez mindenhol
A normális eloszlások mindenütt jelen vannak. Ennek oka a Központi Limit Tételből származik. Gyakran, ha egy értéket mérnek, az sok független változó összesített hatása. Ezért maga a mérendő érték minta átlagértékkel rendelkezik. Például a sportoló teljesítményeinek megoszlása harang alakú lehet, az étrend, az edzés, a genetika, az edzés és a pszichológia különbségei következtében. Még a férfiak magassága is normális eloszlású, sok biológiai tényező függvénye.
Gauss-kopulák
Az úgynevezett „kopulafüggvénynek”, Gauss-eloszlással, 2009-ben került a hírekbe, mert a fedezett kötvényekbe való befektetés kockázatának értékelésére használják. A funkcióval való visszaélés alapvető szerepet játszott a 2008–2009 közötti pénzügyi válságban. Noha a válságnak számos oka volt, utólag a Gauss-eloszlásokat valószínűleg nem kellett volna használni. A vastagabb farokkal rendelkező funkció nagyobb valószínűséget adott volna a nemkívánatos eseményeknek.
Származtatás
A központi határ tétel sok sorban bizonyítható a (minta) pillanatgeneráló függvényének (mgf) elemzésével átlag - populációs átlag) /? (populációs variancia / minta nagysága) az alapul szolgáló populáció mgf függvényében. A tétel közelítő részét úgy vezetjük be, hogy az alapul szolgáló populáció mgf-jét hatványsorként kibővítjük, majd a legtöbb kifejezés jelentéktelen, mivel a minta nagysága megnő.
Sokkal kevesebb sorban bizonyítható, ha Taylor-bővítést alkalmazunk ugyanazon függvény jellegzetes egyenletén, és a minta nagyságát nagyra növeljük.
Számítási kényelem
Egyes statisztikai modellek feltételezik, hogy a hibák Gauss-féleek. Ez lehetővé teszi a normál változók függvényeinek eloszlásának, például a khi-négyzet- és F-eloszlásnak a hipotézis tesztelésében való felhasználását. Pontosabban, az F-tesztben az F statisztika a khi-négyzet eloszlások arányából áll, amelyek maguk is egy normál varianciaparaméter függvényei. A kettő aránya a variancia törlését eredményezi, lehetővé téve a hipotézisek tesztelését anélkül, hogy tudnánk a varianciákat, a normálistól és az állandóságtól eltekintve.