Kas yra Gauso pasiskirstymas?

Statistikoje Gauso arba normalusis skirstinys naudojamas apibūdinti sudėtingas sistemas su daugeliu veiksnių. Kaip aprašyta Stepheno Stiglerio „Statistikos istorijoje“, Abraomas De Moivre'as išrado platinimą, kuris turi Karlo Fredricko Gausso vardą. Gausso indėlis buvo jo paskirstymo mažiausiems kvadratams metodo taikymas, siekiant kuo labiau sumažinti klaidą pritaikant duomenis geriausiai tinkančiai linijai. Taigi jis padarė svarbiausią statistikos klaidų pasiskirstymą.

Motyvacija

Koks yra duomenų imties pasiskirstymas? Ką daryti, jei nežinote pagrindinio duomenų paskirstymo? Ar yra kokiu nors būdu patikrinti hipotezes apie duomenis, nežinant pagrindinio pasiskirstymo? Dėl centrinės ribos teoremos atsakymas yra teigiamas.

Teoremos teiginys

Jame teigiama, kad begalinės populiacijos imties vidurkis yra maždaug normalus arba Gauso, su vidurkiu tokia pati kaip pagrindinė populiacija, ir dispersija, lygi populiacijos dispersijai, padalintai iš imties dydžio. Apytikslė vertė pagerėja, kai imties dydis tampa didelis.

Apytikslis teiginys kartais neteisingas kaip išvada apie konvergenciją į normalų skirstinį. Kadangi apytikslis normalus pasiskirstymas keičiasi didėjant imties dydžiui, toks teiginys yra klaidinantis.

Teoremą sukūrė Pierre'as Simonas Laplasas.

Kodėl tai yra visur

Normalūs pasiskirstymai yra visur. Priežastis kyla iš centrinės ribos teoremos. Dažnai vertinant vertę, tai yra daugelio nepriklausomų kintamųjų suma. Todėl pati matuojama vertė turi vidutinę imties kokybę. Pavyzdžiui, sportininkų pasirodymų pasiskirstymas gali būti varpelio formos, atsirandantis dėl dietos, treniruočių, genetikos, treniruočių ir psichologijos skirtumų. Netgi vyrų aukštis pasiskirsto normaliai, priklausomai nuo daugelio biologinių veiksnių.

Gauso kopulos

Tai, kas vadinama „kopulos funkcija“ su Gauso pasiskirstymu, buvo 2009 m. Naujienose, nes ji buvo naudojama vertinant investavimo į užtikrintas obligacijas riziką. Piktnaudžiavimas šia funkcija buvo lemiamas 2008–2009 m. Finansų krizės metu. Nors krizės priežasčių buvo daug, žvelgiant į priekį, Gauso skirstiniai greičiausiai neturėjo būti naudojami. Storesnės uodegos funkcija būtų priskyrusi didesnę tikimybę nepageidaujamiems įvykiams.

Išvedimas

Centrinę ribos teoremą galima įrodyti daugeliu eilučių, analizuojant (imties) momento generavimo funkciją (mgf) vidurkis - populiacijos vidurkis) /? (populiacijos dispersija / imties dydis) kaip pagrindinės populiacijos mgf funkcija. Apytikslė teoremos dalis įvedama išplečiant pagrindinės populiacijos mgf kaip galios eilutę, tada rodoma, kad dauguma terminų yra nereikšmingi, nes imties dydis tampa didelis.

Tai galima įrodyti daug mažiau eilučių, naudojant Tayloro išplėtimą tos pačios funkcijos charakteristinėje lygtyje ir padarant imties dydį dideliu.

Skaičiavimo patogumas

Kai kurie statistiniai modeliai daro prielaidą, kad klaidos yra Gauso. Tai leidžia hipotezių testavimui naudoti normalių kintamųjų funkcijų, tokių kaip chi kvadrato ir F skirstinio, funkcijų paskirstymą. Konkrečiai, atliekant F testą, F statistiką sudaro chi kvadrato skirstinių santykis, kurie patys yra įprasto dispersijos parametro funkcijos. Dviejų santykis lemia dispersijos panaikinimą, leidžiantį patikrinti hipotezes, nežinant apie dispersijas, išskyrus jų normalumą ir pastovumą.

  • Dalintis
instagram viewer