Όταν τοποθετείτε μια ευθεία γραμμή σε ένα σύνολο δεδομένων, μπορεί να σας ενδιαφέρει να προσδιορίσετε πόσο καλά η γραμμή που προκύπτει ταιριάζει στα δεδομένα. Ένας τρόπος για να γίνει αυτό είναι να υπολογίστε το άθροισμα των τετραγώνων σφάλμα (SSE). Αυτή η τιμή παρέχει ένα μέτρο για το πόσο καλά η γραμμή βέλτιστης προσαρμογής προσεγγίζει το σύνολο δεδομένων. Το SSE είναι σημαντικό για την ανάλυση πειραματικών δεδομένων και καθορίζεται μόνο με λίγα σύντομα βήματα.
Βρείτε μια γραμμή που ταιριάζει καλύτερα στο μοντέλο των δεδομένων χρησιμοποιώντας παλινδρόμηση. Η γραμμή βέλτιστης εφαρμογής έχει τη μορφή y = ax + b, όπου a και b είναι παράμετροι που πρέπει να προσδιορίσετε. Μπορείτε να βρείτε αυτές τις παραμέτρους χρησιμοποιώντας μια απλή ανάλυση γραμμικής παλινδρόμησης. Για παράδειγμα, ας υποθέσουμε ότι η γραμμή βέλτιστης εφαρμογής έχει τη μορφή y = 0,8x + 7.
Χρησιμοποιήστε την εξίσωση για να προσδιορίσετε την τιμή κάθε τιμής y που προβλέπεται από τη γραμμή της βέλτιστης εφαρμογής. Μπορείτε να το κάνετε αυτό αντικαθιστώντας κάθε τιμή x στην εξίσωση της γραμμής. Για παράδειγμα, εάν το x είναι ίσο με 1, η αντικατάστασή του στην εξίσωση y = 0,8x + 7 δίνει 7,8 για την τιμή y.
Προσδιορίστε το μέσο όρο των τιμών που προβλέπονται από τη γραμμή της εξίσωσης βέλτιστης εφαρμογής. Μπορείτε να το κάνετε αυτό συνοψίζοντας όλες τις τιμές y που προβλέπονται από τις εξισώσεις και διαιρώντας τον αριθμό που προκύπτει με τον αριθμό των τιμών. Για παράδειγμα, εάν οι τιμές είναι 7,8, 8,6 και 9,4, το άθροισμα αυτών των τιμών δίνει το 25.8 και ο διαχωρισμός αυτού του αριθμού με τον αριθμό των τιμών, 3 σε αυτήν την περίπτωση, δίνει 8,6.
Αφαιρέστε καθεμία από τις μεμονωμένες τιμές από το μέσο όρο και τετραγωνίστε τον αριθμό που προκύπτει. Στο παράδειγμά μας, εάν αφαιρέσουμε την τιμή 7,8 από το μέσο όρο 8,6, ο προκύπτων αριθμός είναι 0,8. Το τετράγωνο αυτής της τιμής δίνει 0,64.
Αθροίστε όλες τις τετραγωνικές τιμές από το Βήμα 4. Εάν εφαρμόσετε τις οδηγίες στο Βήμα 4 και στις τρεις τιμές στο παράδειγμά μας, θα βρείτε τιμές 0,64, 0 και 0,64. Το άθροισμα αυτών των τιμών δίνει 1,28. Αυτό είναι το άθροισμα των σφαλμάτων τετραγώνων.