Πώς να υπολογίσετε τον συντελεστή προσδιορισμού

Η συσχέτιση δεν είναι απαραίτητα ίση αιτία, αλλά η εύρεση συσχέτισης μεταξύ δύο μεταβλητών σε ένα πείραμα εξακολουθεί να είναι μια πολύ σημαντική ένδειξη για τη σχέση μεταξύ τους. Αυτός είναι ο λόγος για τον οποίο οι δοκιμές συσχέτισης είναι ένας από τους πιο συνηθισμένους τύπους στατιστικών δοκιμών που χρησιμοποιούνται στην επιστήμη, με τον πιο γνωστό να είναι ο συντελεστής συσχέτισης του Pearson.

Ωστόσο, ο συντελεστής προσδιορισμού είναι αναμφισβήτητα πιο σημαντικός επειδή σας λέει το ποσοστό της διακύμανσης σε μια μεταβλητή που μπορεί να προβλεφθεί με βάση την άλλη. Αυτός είναι ο λόγος για τον οποίο η εκμάθηση της εκτέλεσης του συντελεστή υπολογισμού προσδιορισμού είναι σημαντική για όποιον εργάζεται με στατιστικά στοιχεία που βασίζονται στη συσχέτιση.

Ποιος είναι ο Συντελεστής Προσδιορισμού;

Ένας βασικός συντελεστής ορισμού είναι ότι είναι το τετράγωνο του συντελεστή συσχέτισης του Pearson, ρ, και έτσι ονομάζεται συχνά R2.

Ο συντελεστής Pearson μετρά τους συσχετισμούς, όπου μια αύξηση σε μια μεταβλητή συνοδεύει είτε μια αύξηση σε μια άλλη (θετική συσχέτιση) είτε μια μείωση σε αυτήν (αρνητική συσχέτιση). Η τιμή για

instagram story viewer
ρ μπορεί να είναι οτιδήποτε μεταξύ −1 και +1, με το μέγεθος του αριθμού να σας λέει τη δύναμη της συσχέτισης και το σύμβολο που σας λέει εάν είναι θετικός ή αρνητικός συσχετισμός.

Ρ2 είναι το τετράγωνο αυτού του μέτρου, οπότε κυμαίνεται μεταξύ 0 και 1 και σας λέει το ποσοστό της διακύμανσης σε μια μεταβλητή που μπορεί να προβλεφθεί από τη συσχετισμένη μεταβλητή. Αυτό είναι χρήσιμο για πολλά πράγματα, ιδίως για τη δημιουργία μαθηματικών μοντέλων για προγνωστικούς σκοπούς.

Συντελεστής υπολογισμού προσδιορισμού

Η διαδικασία υπολογισμού του συντελεστή προσδιορισμού είναι επομένως βασικά η ίδια με τη διαδικασία υπολογισμού του συντελεστή συσχέτισης του Pearson, εκτός από το τέλος που τετράγωνες το αποτέλεσμα. Ο τύπος για τον συντελεστή συσχέτισης του Pearson είναι:

r = \ frac {n \ άθροισμα xy - \ άθροισμα x \ άθροισμα y} {\ sqrt {(n \ άθροισμα x ^ 2 - (\ άθροισμα x) ^ 2) - (n \ άθροισμα ^ ^ - (\ άθροισμα y ) ^ 2)}}

Υπάρχουν μερικά βασικά στοιχεία που χρειάζεστε για να επεξεργαστείτε αυτόν τον τύπο (ομολογουμένως τρομακτικό!): Το δικό σας Χ και ε τιμές για κάθε παρατήρηση (δηλαδή τις δύο μεταβλητές σας), το άθροισμα των Χ και ε τιμές, το άθροισμα κάθε Χ μεταβλητή πολλαπλασιασμένη επί το αντίστοιχο ε μεταβλητή και τα αθροίσματα του καθενός Χ και ε μεταβλητή τετράγωνο.

Ένας βολικός τρόπος για να το επιλύσετε είναι να χρησιμοποιήσετε ένα υπολογιστικό φύλλο πρόγραμμα όπως το Microsoft Excel, με στήλες για Χ, ε, xy, Χ2 και ε2 και αθροίζει στο κάτω μέρος για κάθε στήλη. Θα χρειαστείτε επίσης μια τιμή για ν, το μέγεθος του δείγματός σας (καθένα από τα οποία έχει Χ και ένα ε αξία).

Εκτελέστε τη διαδικασία που υποδεικνύεται από τον τύπο. Πρώτα, πάρτε ν πολλαπλασιαζόμενο με το άθροισμα του xy τιμές και, στη συνέχεια, αφαιρέστε το άθροισμα του Χ τιμές πολλαπλασιαζόμενες με το άθροισμα των ε αξίες.

Διαιρέστε ολόκληρο το αποτέλεσμα με την κάτω ενότητα: ν επί το άθροισμα των τετραγώνων του Χ τιμές, μείον το άθροισμα των Χ τιμές τετράγωνες, όλες πολλαπλασιασμένες με το αποτέλεσμα του ίδιου πράγμα για σας ε τιμές, λαμβάνοντας τελικά την τετραγωνική ρίζα πριν από την εκτέλεση της διαίρεσης. Αυτό σας δίνει ρ, το οποίο απλώς τετράγωνο για να λάβετε R2.

Ερμηνεία του Συντελεστή Προσδιορισμού

Ο συντελεστής προσδιορισμού είναι ένας αριθμός μεταξύ 0 και 1, ο οποίος μπορεί να μετατραπεί σε ποσοστό πολλαπλασιάζοντας επί 100. Ο τυπικός συντελεστής ερμηνείας προσδιορισμού είναι το ποσό της διακύμανσης σε y που μπορεί να εξηγηθεί από ΧΜε άλλα λόγια, πόσο καλά τα δεδομένα ταιριάζουν με το μοντέλο παλινδρόμησης που χρησιμοποιείτε το περιγράφουν.

Ωστόσο, είναι σημαντικό να σημειώσετε τις συνήθεις προειδοποιήσεις που υπάρχουν σε δεδομένα βάσει συσχετίσεων. Είναι απολύτως δυνατό για δύο μεταβλητές να συσχετιστούν χωρίς να σχετίζονται αιτιώδη.

Για παράδειγμα, πάρτε τη σχέση μεταξύ της χρήσης ακουστικών βαρηκοΐας και του αριθμού των ρυτίδων στο δέρμα σας. Υπάρχει μια ισχυρή συσχέτιση μεταξύ των δύο, αλλά φυσικά και τα δύο προκαλούνται πραγματικά από τα γηρατειά. Αυτό δεν είναι ελάττωμα με την προσέγγιση, αλλά ως περιορισμός που πρέπει να λάβετε υπόψη για να ερμηνεύσετε σωστά τα αποτελέσματα.

Teachs.ru
  • Μερίδιο
instagram viewer