Το διάγραμμα διασποράς είναι ένα σημαντικό διαγνωστικό εργαλείο στο οπλοστάσιο ενός στατιστικολόγου, το οποίο λαμβάνεται γράφοντας δύο μεταβλητές μεταξύ τους. Επιτρέπει στον στατιστικολόγο να βλέπει τις μεταβλητές και να διαμορφώνει μια λειτουργική υπόθεση για τη σχέση τους. Για το λόγο αυτό, σχεδιάζεται συνήθως πριν από την ανάλυση παλινδρόμησης. Ο στατιστικολόγος στη συνέχεια δοκιμάζει την υπόθεση χρησιμοποιώντας μια ανάλυση παλινδρόμησης και καθορίζει το σημείο και το ακριβές μέγεθος της σχέσης. Επιπλέον, ένα διάγραμμα διασποράς βοηθά στον εντοπισμό ακραίων τιμών - τιμών που είναι ασυνήθιστα απομακρυσμένες από τα περισσότερα δεδομένα του δείγματος. Η εξάλειψη των ακραίων τιμών συμβάλλει στη βελτίωση του μοντέλου παλινδρόμησης.
Ελέγξτε για αρνητική σχέση μεταξύ των δύο μεταβλητών στο διάγραμμα διασποράς. Εάν οι χαμηλές τιμές της πρώτης μεταβλητής αντιστοιχούν σε υψηλές τιμές της δεύτερης μεταβλητής, υπάρχει αρνητικός συσχετισμός. Σε αυτήν την περίπτωση, μια γραμμή που σχηματίζεται μέσω των σημείων δεδομένων έχει αρνητική κλίση.
Εξετάστε το διάγραμμα διασποράς για θετική σχέση μεταξύ των μεταβλητών. Εάν οι χαμηλές τιμές της πρώτης μεταβλητής στο διάγραμμα σκέδασης αντιστοιχούν με χαμηλές τιμές του δεύτερου, και το υψηλό Οι τιμές του πρώτου αντιστοιχούν παρομοίως με τις υψηλές τιμές του δεύτερου, οι μεταβλητές έχουν θετικό συσχέτιση. Σε αυτήν την περίπτωση, μια γραμμή που σχεδιάζεται μέσω των σημείων δεδομένων έχει θετική κλίση.
Επιθεωρήστε το διάγραμμα διασποράς για καμία σχέση μεταξύ των μεταβλητών. Εάν τα σημεία δεδομένων στο διάγραμμα διασποράς κατανέμονται τυχαία χωρίς εμφανή σχέση μεταξύ των δύο, δεν έχουν καμία συσχέτιση ή μικρή, στατιστικά ασήμαντη συσχέτιση. Σε αυτήν την περίπτωση, μια γραμμή που σχηματίζεται μέσω των σημείων δεδομένων είναι οριζόντια με κλίση ίση με μηδέν.
Τοποθετήστε μια γραμμή στα σημεία δεδομένων και εξετάστε το σχήμα της για να μετρήσετε τη φύση της σχέσης μεταξύ των δύο μεταβλητών. Μια ευθεία γραμμή ερμηνεύεται ως μια γραμμική σχέση, ένα καμπύλο σχήμα υποδηλώνει μια τετραγωνική σχέση και ένα γραμμή που βρίσκεται σχετικά επίπεδη πριν ξαφνικά γυρίσματα πάνω ή κάτω ερμηνεύεται ως εκθετική σχέση.
Εξετάστε το διάγραμμα διασποράς για ακραίες τιμές, τιμές που βρίσκονται ασυνήθιστα μακριά από το σύμπλεγμα σημείων δεδομένων. Το Outliers παραμορφώνει τη σχέση μεταξύ των μεταβλητών. Εξαλείψτε τα, αλλά μόνο εάν η απουσία τους δεν επηρεάζει την ανάλυση της σχέσης μεταξύ των δύο μεταβλητών.