Πειράματα δοκιμής προβλέψεις. Αυτές οι προβλέψεις είναι συχνά αριθμητικές, πράγμα που σημαίνει ότι, καθώς οι επιστήμονες συλλέγουν δεδομένα, αναμένουν ότι οι αριθμοί θα αναλυθούν με έναν συγκεκριμένο τρόπο. Τα δεδομένα του πραγματικού κόσμου σπάνια ταιριάζουν ακριβώς με τις προβλέψεις που κάνουν οι επιστήμονες, οπότε οι επιστήμονες χρειάζονται μια δοκιμή για να τους πει εάν η διαφορά μεταξύ των παρατηρηθέντων και οι αναμενόμενοι αριθμοί οφείλονται σε τυχαίες πιθανότητες ή λόγω κάποιου απρόβλεπτου παράγοντα που θα αναγκάσει τον επιστήμονα να προσαρμόσει την υποκείμενη θεωρία. Μια δοκιμή chi-square είναι ένα στατιστικό εργαλείο που οι επιστήμονες χρησιμοποιούν για το σκοπό αυτό.
Ο απαιτούμενος τύπος δεδομένων
Χρειάζεστε κατηγορηματικά δεδομένα για να χρησιμοποιήσετε μια δοκιμή chi-square. Ένα παράδειγμα κατηγορηματικών δεδομένων είναι ο αριθμός των ατόμων που απάντησαν σε μια ερώτηση "ναι" έναντι του αριθμού των ατόμων που απάντησαν η ερώτηση "όχι" (δύο κατηγορίες) ή οι αριθμοί βατράχων σε έναν πληθυσμό που είναι πράσινο, κίτρινο ή γκρι (τρεις κατηγορίες). Δεν μπορείτε να χρησιμοποιήσετε μια δοκιμή chi-square σε συνεχή δεδομένα, όπως μπορεί να συλλέγονται από μια έρευνα που ρωτά τους ανθρώπους πόσο ψηλά είναι. Από μια τέτοια έρευνα, θα έχετε ένα ευρύ φάσμα υψών. Ωστόσο, εάν διαιρέσατε τα ύψη σε κατηγορίες όπως "ύψος κάτω από 6 πόδια" και "ύψος 6 πόδια και άνω", τότε θα μπορούσατε να χρησιμοποιήσετε μια δοκιμή chi-square στα δεδομένα.
Το τεστ Goodness-of-Fit
Ένα τεστ ευεξίας είναι ένα συνηθισμένο, και ίσως το πιο απλό, τεστ που εκτελείται χρησιμοποιώντας τη στατιστική chi-square. Σε μια δοκιμή ευεξίας, η επιστήμονας κάνει μια συγκεκριμένη πρόβλεψη σχετικά με τους αριθμούς που αναμένει να δει σε κάθε κατηγορία των δεδομένων της. Στη συνέχεια, συλλέγει δεδομένα πραγματικού κόσμου - που ονομάζονται δεδομένα που παρατηρούνται - και χρησιμοποιεί τη δοκιμή chi-square για να δει αν τα παρατηρούμενα δεδομένα ταιριάζουν με τις προσδοκίες της.
Για παράδειγμα, φανταστείτε ότι ένας βιολόγος μελετά τα πρότυπα κληρονομιάς σε ένα είδος βατράχου. Μεταξύ 100 απογόνων ενός συνόλου γονέων βατράχων, το γενετικό μοντέλο του βιολόγου την οδηγεί να περιμένει 25 κίτρινους απογόνους, 50 πράσινους απογόνους και 25 γκρίζους απογόνους. Αυτό που πραγματικά παρατηρεί είναι 20 κίτρινοι απόγονοι, 52 πράσινοι απόγονοι και 28 γκρίζοι απόγονοι. Υποστηρίζεται η πρόβλεψή της ή είναι λανθασμένο το γενετικό της μοντέλο; Μπορεί να χρησιμοποιήσει μια δοκιμή chi-square για να μάθει.
Υπολογισμός της στατιστικής Chi-Square
Ξεκινήστε να υπολογίζετε το στατιστικό τετράγωνο chi αφαιρώντας κάθε αναμενόμενη τιμή από την αντίστοιχη παρατηρούμενη τιμή και τετραγωνίζοντας κάθε αποτέλεσμα. Ο υπολογισμός για το παράδειγμα του απογόνου βατράχου θα μοιάζει με τον εξής:
κίτρινο = (20 - 25) ^ 2 = 25 πράσινο = (52 - 50) ^ 2 = 4 γκρι = (28 - 25) ^ 2 = 9
Τώρα διαιρέστε κάθε αποτέλεσμα με την αντίστοιχη αναμενόμενη τιμή του.
κίτρινο = 25 ÷ 25 = 1 πράσινο = 4 ÷ 50 = 0,08 γκρι = 9 ÷ 25 = 0,36
Τέλος, προσθέστε μαζί τις απαντήσεις από το προηγούμενο βήμα.
chi-square = 1 + 0,08 + 0,36 = 1,44
Ερμηνεία της στατιστικής Chi-Square
Η στατιστική chi-square σας λέει πόσο διαφορετικές ήταν οι παρατηρούμενες τιμές σας από τις προβλεπόμενες τιμές σας. Όσο υψηλότερος είναι ο αριθμός, τόσο μεγαλύτερη είναι η διαφορά. Μπορείτε να προσδιορίσετε αν η τιμή του τετραγώνου σας είναι πολύ υψηλή ή αρκετά χαμηλή για να υποστηρίξει την πρόβλεψή σας, βλέποντας εάν είναι κάτω από ένα συγκεκριμένο κρίσιμη αξία σε έναν πίνακα διανομής chi-square. Αυτός ο πίνακας ταιριάζει με τιμές chi-square με πιθανότητες, που ονομάζονται τιμές p. Συγκεκριμένα, ο πίνακας σας λέει την πιθανότητα ότι οι διαφορές μεταξύ των παρατηρούμενων και των αναμενόμενων τιμών σας οφείλονται απλώς σε τυχαία πιθανότητα ή εάν υπάρχει κάποιος άλλος παράγοντας. Για μια δοκιμή ευεξίας, εάν η τιμή p είναι 0,05 ή λιγότερο, τότε πρέπει να απορρίψετε την πρόβλεψή σας.
Πρέπει να καθορίσετε το βαθμοί ελευθερίας (df) στα δεδομένα σας προτού μπορέσετε να αναζητήσετε την κρίσιμη τιμή chi-square σε έναν πίνακα διανομής. Οι βαθμοί ελευθερίας υπολογίζονται αφαιρώντας το 1 από τον αριθμό των κατηγοριών στα δεδομένα σας. Υπάρχουν τρεις κατηγορίες σε αυτό το παράδειγμα, οπότε υπάρχουν 2 βαθμοί ελευθερίας. Μια ματιά στο αυτόν τον πίνακα διανομής chi-square σας λέει ότι, για 2 βαθμούς ελευθερίας, η κρίσιμη τιμή για πιθανότητα 0,05 είναι 5,99. Αυτό σημαίνει ότι όσο η υπολογισμένη τιμή του τετραγώνου chi είναι μικρότερη από 5,99, οι αναμενόμενες τιμές σας και, συνεπώς, η υποκείμενη θεωρία, είναι έγκυρες και υποστηρίζονται. Δεδομένου ότι η στατιστική chi-square για τα δεδομένα απογόνων βατράχου ήταν 1,44, η βιολόγος μπορεί να αποδεχτεί το γενετικό της μοντέλο.