რა არის გაუსის განაწილება?

სტატისტიკური მონაცემებით, გაუსის, ან ნორმალური, განაწილება გამოიყენება მრავალი ფაქტორის მქონე რთული სისტემების დასახასიათებლად. როგორც სტივენ სტიგლერის სტატისტიკის ისტორიაშია აღწერილი, აბრაამ დე მოევრმა გამოიგონა დისტრიბუცია, რომელიც ატარებს კარლ ფრედრიკ გაუსის სახელს. გაუსის კონტრიბუცია იყო განაწილების გამოყენება მინიმუმ კვადრატებზე მიდგომაში, რათა შემცირდეს შეცდომა მონაცემების საუკეთესოდ მოთავსების ხაზში. ამრიგად, მან ეს სტატისტიკის ყველაზე მნიშვნელოვან შეცდომად გადანაწილება გახადა.

Მოტივაცია

რა არის მონაცემთა ნიმუშის განაწილება? რა მოხდება, თუ არ იცით მონაცემების ძირითადი განაწილება? არსებობს რაიმე მეთოდი ჰიპოთეზების შესამოწმებლად მონაცემთა შესახებ, რომ არ იცოდეს ძირითადი განაწილება? ცენტრალური ლიმიტის თეორემის წყალობით, პასუხი დადებითია.

თეორემის განცხადება

მასში ნათქვამია, რომ უსასრულო მოსახლეობის საშუალო ნიმუში დაახლოებით ნორმალურია, ან გაუსი, საშუალოთი იგივეა, რაც ძირითადი მოსახლეობა და ვარიაცია ტოლია პოპულაციის ვარიაციისა, რომელიც გაყოფილია ნიმუშზე ზომა მიახლოება უმჯობესდება, რადგან ნიმუშის ზომა დიდი ხდება.

მიახლოების დებულება ზოგჯერ არასწორად არის მითითებული, როგორც დასკვნა ნორმალურ განაწილებაზე კონვერგენციის შესახებ. მას შემდეგ, რაც დაახლოებით ნორმალური განაწილება იცვლება, როგორც ნიმუშის ზომა იზრდება, ასეთი განცხადება შეცდომაში შეჰყავს.

თეორემა შეიმუშავა პიერ სიმონ ლაპლასმა.

რატომ არის ყველგან

ჩვეულებრივი განაწილება ყველგან არის. მიზეზი მოდის ცენტრალური ლიმიტის თეორემადან. ხშირად, როდესაც მნიშვნელობა იზომება, ეს არის მრავალი დამოუკიდებელი ცვლადის ჯამის ეფექტი. ამიტომ, თავად გაზომულ მნიშვნელობას აქვს საშუალო - საშუალო ხარისხის. მაგალითად, სპორტსმენის სპექტაკლების განაწილებას შეიძლება ჰქონდეს ზარის ფორმა, დიეტის, ვარჯიშის, გენეტიკის, მწვრთნელობისა და ფსიქოლოგიის განსხვავებების შედეგად. მამაკაცის სიმაღლესაც კი აქვს ნორმალური განაწილება, რაც მრავალი ბიოლოგიური ფაქტორის ფუნქციაა.

გაუსის კოპულები

ის, რასაც "კოპულის ფუნქციას" უწოდებენ, გაუსის დისტრიბუციით, იყო სიახლეები 2009 წელს, რადგან იგი გამოიყენებოდა უზრუნველყოფილი ობლიგაციებით ინვესტიციის რისკის შესაფასებლად. ფუნქციის არასწორად გამოყენება მნიშვნელოვან როლს ასრულებდა 2008-2009 წლების ფინანსურ კრიზისში. მიუხედავად იმისა, რომ კრიზისის მრავალი მიზეზი არსებობდა, უკანასკნელი აზრით, გაუსის განაწილება სავარაუდოდ არ უნდა ყოფილიყო გამოყენებული. უფრო სქელი კუდის მქონე ფუნქცია უარყოფით მოვლენებს უფრო მეტ ალბათობას მიანიჭებს.

დერივაცია

ცენტრალური ლიმიტის თეორემა შეიძლება დამტკიცდეს მრავალ სტრიქონში (ნიმუშის) მომენტის გამომუშავებელი ფუნქციის (მგფ) ანალიზით საშუალო - პოპულაციის საშუალო) /? (პოპულაციის ვარიაცია / ნიმუშის ზომა), როგორც ძირითადი მოსახლეობის მგფ-ის ფუნქცია. თეორემის მიახლოებითი ნაწილი შემოღებულია ძირითადი პოპულაციის მგფ – ის, როგორც ენერგიის სერიის გაფართოებით, შემდეგ უმეტეს ტერმინთა ჩვენება უმნიშვნელოა, რადგან ნიმუშის ზომა დიდი ხდება.

ამის დადასტურება ბევრად უფრო ნაკლებ სტრიქონებში შესაძლებელია Taylor გაფართოების გამოყენებით იმავე ფუნქციის მახასიათებელ განტოლებაზე და ნიმუშის ზომა დიდი გახდეს.

გამოთვლითი მოხერხებულობა

ზოგიერთ სტატისტიკურ მოდელში დაშვებულია შეცდომა Gaussian. ეს საშუალებას იძლევა ნორმალური ცვლადების ფუნქციების განაწილება, როგორიცაა chi- და F- განაწილება, გამოყენებული იქნას ჰიპოთეზის ტესტირებაში. კერძოდ, F- ტესტში, F სტატისტიკა შედგება chi- კვადრატული განაწილების თანაფარდობისგან, რაც თავისთავად წარმოადგენს ნორმალური ცვალებადობის პარამეტრის ფუნქციებს. ორის თანაფარდობა იწვევს დისპერსიის გაუქმებას, რაც ჰიპოთეზის შემოწმებას საშუალებას აძლევს შეცდომების ცოდნის გარეშე, გარდა მათი ნორმალიზმისა და მუდმივობისა.

  • გაზიარება
instagram viewer