Τι είναι η διανομή Gaussian;

Στα στατιστικά, η κατανομή Gaussian, ή κανονική, χρησιμοποιείται για τον χαρακτηρισμό σύνθετων συστημάτων με πολλούς παράγοντες. Όπως περιγράφεται στο Stephen Stigler's The History of Statistics, ο Abraham De Moivre εφηύρε τη διανομή που φέρει το όνομα του Karl Fredrick Gauss. Η συνεισφορά του Gauss έγκειται στην εφαρμογή της προσέγγισης διανομής στα ελάχιστα τετράγωνα για την ελαχιστοποίηση του σφάλματος στην τοποθέτηση δεδομένων με μια γραμμή βέλτιστης εφαρμογής. Το έκανε έτσι τη σημαντικότερη κατανομή σφαλμάτων στα στατιστικά.

Κίνητρο

Ποια είναι η διανομή ενός δείγματος δεδομένων; Τι γίνεται αν δεν γνωρίζετε την υποκείμενη διανομή των δεδομένων; Υπάρχει τρόπος να δοκιμάσετε υποθέσεις σχετικά με τα δεδομένα χωρίς να γνωρίζετε την υποκείμενη κατανομή; Χάρη στο Θεώρημα Central Limit, η απάντηση είναι ναι.

Δήλωση του Θεωρήματος

Αναφέρει ότι ένα μέσο δείγμα από έναν άπειρο πληθυσμό είναι περίπου φυσιολογικό, ή Gaussian, με μέσο όρο το ίδιο με τον υποκείμενο πληθυσμό και διακύμανση ίση με τη διακύμανση πληθυσμού διαιρεμένη με το δείγμα Μέγεθος. Η προσέγγιση βελτιώνεται καθώς το μέγεθος του δείγματος μεγαλώνει.

instagram story viewer

Η δήλωση προσέγγισης μερικές φορές είναι λανθασμένη ως συμπέρασμα σχετικά με τη σύγκλιση σε μια κανονική κατανομή. Δεδομένου ότι η κατά προσέγγιση κανονική κατανομή αλλάζει καθώς αυξάνεται το μέγεθος του δείγματος, μια τέτοια δήλωση είναι παραπλανητική.

Το θεώρημα αναπτύχθηκε από τον Pierre Simon Laplace.

Γιατί είναι παντού

Οι κανονικές διανομές είναι πανταχού παρούσες. Ο λόγος προέρχεται από το Θεώρημα Central Limit. Συχνά, όταν μετράται μια τιμή, είναι το συνολικό αποτέλεσμα πολλών ανεξάρτητων μεταβλητών. Επομένως, η ίδια η τιμή που μετριέται έχει μια ποιότητα δείγματος-μέσου. Για παράδειγμα, μια διανομή των παραστάσεων του αθλητή μπορεί να έχει σχήμα καμπάνας, ως αποτέλεσμα των διαφορών στη διατροφή, την προπόνηση, τη γενετική, την καθοδήγηση και την ψυχολογία. Ακόμα και τα ύψη των ανδρών έχουν μια φυσιολογική κατανομή, συνάρτηση πολλών βιολογικών παραγόντων.

Gaussian Copulas

Αυτό που ονομάζεται «συνάρτηση copula» με μια διανομή Gauss ήταν στις ειδήσεις το 2009 λόγω της χρήσης του στην εκτίμηση του κινδύνου επένδυσης σε εξασφαλισμένα ομόλογα. Η κατάχρηση της λειτουργίας ήταν καθοριστική για την οικονομική κρίση του 2008-2009. Αν και υπήρχαν πολλές αιτίες της κρίσης, στο παρελθόν οι διανομές Gauss πιθανότατα δεν θα έπρεπε να είχαν χρησιμοποιηθεί. Μια συνάρτηση με πιο παχιά ουρά θα έχει εκχωρήσει μεγαλύτερη πιθανότητα για ανεπιθύμητα συμβάντα.

Παραγωγή

Το Θεώρημα Central Limit μπορεί να αποδειχθεί σε πολλές γραμμές αναλύοντας τη λειτουργία δημιουργίας ροπής (mgf) του (δείγματος μέσος όρος - μέσος πληθυσμός) /? (διακύμανση πληθυσμού / μέγεθος δείγματος) ως συνάρτηση του mgf του υποκείμενου πληθυσμού. Το μέρος προσέγγισης του θεωρήματος εισάγεται με την επέκταση του mgf του υποκείμενου πληθυσμού ως σειρά ισχύος και, στη συνέχεια, δείχνει ότι οι περισσότεροι όροι είναι ασήμαντοι καθώς το μέγεθος του δείγματος μεγαλώνει.

Μπορεί να αποδειχθεί σε πολύ λιγότερες γραμμές χρησιμοποιώντας μια επέκταση Taylor στη χαρακτηριστική εξίσωση της ίδιας λειτουργίας και κάνοντας το μέγεθος του δείγματος μεγάλο.

Υπολογιστική ευκολία

Ορισμένα στατιστικά μοντέλα υποθέτουν ότι τα λάθη είναι Gaussian. Αυτό επιτρέπει τη διανομή συναρτήσεων φυσιολογικών μεταβλητών, όπως η κατανομή chi-square- και F, για χρήση στη δοκιμή υπόθεσης. Συγκεκριμένα, στη δοκιμή F, το στατιστικό στοιχείο F αποτελείται από μια αναλογία κατανομών chi-square, οι οποίες οι ίδιες είναι συναρτήσεις μιας παραμέτρου κανονικής διακύμανσης. Η αναλογία των δύο προκαλεί την ακύρωση της διακύμανσης, επιτρέποντας τον έλεγχο υποθέσεων χωρίς γνώση των διαφορών εκτός από την κανονικότητα και τη σταθερότητά τους.

Teachs.ru
  • Μερίδιο
instagram viewer