Kas ir Gausa izplatība?

Statistikā Gausa jeb normālais sadalījums tiek izmantots, lai raksturotu sarežģītas sistēmas ar daudziem faktoriem. Kā aprakstīts Stīvena Štiglera grāmatā “Statistikas vēsture”, Ābrahams De Moivre izgudroja izplatīšanu, kas nes Kārļa Fredrika Gausa vārdu. Gausa ieguldījums bija viņa pieejas sadalījums mazākajam kvadrātam piemērošanā, lai samazinātu kļūdu, pielāgojot datus ar vispiemērotāko līniju. Tādējādi viņš to padarīja par vissvarīgāko kļūdu sadalījumu statistikā.

Motivācija

Kāds ir datu izlases sadalījums? Ko darīt, ja nezināt datu pamatā esošo izplatīšanu? Vai ir kāds veids, kā pārbaudīt hipotēzes par datiem, nezinot pamatā esošo sadalījumu? Pateicoties centrālās robežas teorēmai, atbilde ir jā.

Teorēmas paziņojums

Tajā teikts, ka izlases vidējais rādītājs no bezgalīgas populācijas ir aptuveni normāls jeb Gauss, ar vidējo tāda pati kā pamata populācija, un dispersija, kas vienāda ar populācijas dispersiju, dalītu ar izlasi Izmērs. Aproksimācija uzlabojas, jo izlases lielums kļūst liels.

instagram story viewer

Aproksimācijas apgalvojums dažreiz tiek nepareizi novērtēts kā secinājums par konverģenci normālam sadalījumam. Tā kā aptuvenais normālais sadalījums mainās, palielinoties izlases lielumam, šāds apgalvojums ir maldinošs.

Teorēmu izstrādāja Pjērs Saimons Laplass.

Kāpēc tas ir visur

Normālie sadalījumi ir visur sastopami. Iemesls nāk no centrālās robežas teorēmas. Bieži vien, kad tiek mērīta vērtība, tā ir daudzu neatkarīgo mainīgo summa. Tāpēc pašai mērāmajai vērtībai ir vidējā parauga kvalitāte. Piemēram, sportistu sniegumu sadalījumam var būt zvana forma diētas, apmācības, ģenētikas, trenera un psiholoģijas atšķirību dēļ. Pat vīriešu augumam ir normāls sadalījums, kas ir daudzu bioloģisko faktoru funkcija.

Gausa kopulas

Tas, ko sauc par “kopulas funkciju” ar Gausa sadalījumu, 2009. gadā bija ziņās, jo to izmantoja, novērtējot risku ieguldīt nodrošinātajās obligācijās. Funkcijas nepareiza izmantošana bija nozīmīga finanšu krīzē 2008. – 2009. Lai gan krīzei bija daudz cēloņu, visticamāk, nevajadzēja izmantot Gausa sadalījumus. Funkcija ar biezāku asti būtu piešķīrusi lielāku varbūtību nelabvēlīgiem notikumiem.

Atvasinājums

Centrālās robežas teorēmu var pierādīt daudzās rindās, analizējot (parauga) momenta ģenerēšanas funkciju (mgf) vidējais - populācijas vidējais) /? (populācijas dispersija / izlases lielums) kā funkcija no pamata populācijas mgf. Teorēmas aproksimācijas daļa tiek ieviesta, paplašinot pamata populācijas mgf kā jaudas sēriju, pēc tam lielākā daļa terminu tiek parādīti nenozīmīgi, jo izlases lielums kļūst liels.

To var pierādīt daudz mazāk līniju, izmantojot Teilora paplašinājumu tās pašas funkcijas raksturīgajam vienādojumam un padarot izlases lielumu lielu.

Skaitļošanas ērtības

Daži statistikas modeļi pieļauj, ka kļūdas ir Gausa. Tas ļauj normālu mainīgo funkciju sadalījumus, piemēram, hī-kvadrāta un F sadalījumu, izmantot hipotēzes pārbaudē. Konkrēti, F testā F statistiku veido hī-kvadrāta sadalījumu attiecība, kas pašas ir normālas dispersijas parametra funkcijas. Abu attiecība izraisa dispersijas atcelšanu, ļaujot pārbaudīt hipotēzes, nezinot par dispersijām, izņemot to normālumu un pastāvību.

Teachs.ru
  • Dalīties
instagram viewer