Η πολλαπλή παλινδρόμηση χρησιμοποιείται για να εξετάσει τη σχέση μεταξύ αρκετών ανεξάρτητων μεταβλητών και μιας εξαρτημένης μεταβλητής. Ενώ πολλαπλά μοντέλα παλινδρόμησης σάς επιτρέπουν να αναλύετε τις σχετικές επιρροές αυτών των ανεξάρτητων ή προγνωστικών μεταβλητών το εξαρτώμενο ή κριτήριο μεταβλητή, αυτά τα συχνά περίπλοκα σύνολα δεδομένων μπορούν να οδηγήσουν σε ψευδή συμπεράσματα εάν δεν αναλυθούν σωστά.
Παραδείγματα πολλαπλής παλινδρόμησης
Ένας κτηματομεσίτης θα μπορούσε να χρησιμοποιήσει πολλαπλή παλινδρόμηση για να αναλύσει την αξία των σπιτιών. Για παράδειγμα, μπορούσε να χρησιμοποιήσει ως ανεξάρτητες μεταβλητές το μέγεθος των σπιτιών, τις ηλικίες τους, τον αριθμό των υπνοδωματίων, τη μέση τιμή του σπιτιού στη γειτονιά και την εγγύτητα με τα σχολεία. Σχεδιάζοντας αυτά σε ένα μοντέλο πολλαπλής παλινδρόμησης, τότε θα μπορούσε να χρησιμοποιήσει αυτούς τους παράγοντες για να δει τη σχέση τους με τις τιμές των σπιτιών ως κριτήριο μεταβλητή.
Ένα άλλο παράδειγμα της χρήσης ενός μοντέλου πολλαπλής παλινδρόμησης θα μπορούσε να είναι κάποιος στο ανθρώπινο δυναμικό που καθορίζει το μισθό των διοικητικών θέσεων - η μεταβλητή κριτηρίου. Οι μεταβλητές πρόβλεψης θα μπορούσαν να είναι η αρχαιότητα κάθε διαχειριστή, ο μέσος αριθμός ωρών εργασίας, ο αριθμός των ατόμων που διαχειρίζονται και ο προϋπολογισμός τμήματος του διαχειριστή.
Πλεονεκτήματα της πολλαπλής παλινδρόμησης
Υπάρχουν δύο βασικά πλεονεκτήματα στην ανάλυση δεδομένων χρησιμοποιώντας ένα μοντέλο πολλαπλής παλινδρόμησης. Το πρώτο είναι η ικανότητα προσδιορισμού της σχετικής επιρροής μιας ή περισσότερων μεταβλητών πρόβλεψης στην τιμή κριτηρίου. Ο κτηματομεσίτης θα μπορούσε να διαπιστώσει ότι το μέγεθος των σπιτιών και ο αριθμός των υπνοδωματίων έχουν ισχυρή συσχέτιση με την τιμή ενός σπίτι, ενώ η γειτνίαση με τα σχολεία δεν έχει καθόλου συσχέτιση, ή ακόμη και μια αρνητική συσχέτιση εάν είναι κυρίως συνταξιοδότηση κοινότητα.
Το δεύτερο πλεονέκτημα είναι η ικανότητα εντοπισμού ακραίων τιμών ή ανωμαλιών. Για παράδειγμα, κατά την εξέταση των δεδομένων που σχετίζονται με τους μισθούς διαχείρισης, ο διαχειριστής ανθρώπινων πόρων θα μπορούσε να βρει ότι το Ο αριθμός των ωρών εργασίας, το μέγεθος του τμήματος και ο προϋπολογισμός του είχαν ισχυρή σχέση με τους μισθούς, ενώ η αρχαιότητα δεν. Εναλλακτικά, θα μπορούσε να είναι ότι όλες οι αναφερόμενες τιμές πρόβλεψης συσχετίστηκαν με καθέναν από τους μισθούς που εξετάστηκαν, εκτός από έναν διαχειριστή που πληρώθηκε υπερβολικά σε σύγκριση με τους άλλους.
Μειονεκτήματα της πολλαπλής παλινδρόμησης
Οποιοδήποτε μειονέκτημα της χρήσης ενός μοντέλου πολλαπλής παλινδρόμησης συνήθως οφείλεται στα δεδομένα που χρησιμοποιούνται. Δύο παραδείγματα αυτού είναι η χρήση ελλιπών δεδομένων και το ψευδές συμπέρασμα ότι η συσχέτιση είναι αιτία.
Κατά την εξέταση της τιμής των σπιτιών, για παράδειγμα, ας υποθέσουμε ότι ο κτηματομεσίτης εξέτασε μόνο 10 σπίτια, επτά από τα οποία αγοράστηκαν από νέους γονείς. Σε αυτήν την περίπτωση, η σχέση μεταξύ της εγγύτητας των σχολείων μπορεί να την οδηγήσει να πιστέψει ότι αυτό είχε επίδραση στην τιμή πώλησης για όλα τα σπίτια που πωλούνται στην κοινότητα. Αυτό απεικονίζει τις παγίδες ελλιπών δεδομένων. Εάν είχε χρησιμοποιήσει ένα μεγαλύτερο δείγμα, θα μπορούσε να βρει ότι, από τα 100 σπίτια που πουλήθηκαν, μόνο το 10% των αξιών του σπιτιού αφορούσαν την εγγύτητα ενός σχολείου. Εάν είχε χρησιμοποιήσει τις ηλικίες των αγοραστών ως αξία πρόβλεψης, θα μπορούσε να βρει ότι οι νεότεροι αγοραστές ήταν πρόθυμοι να πληρώσουν περισσότερα για σπίτια στην κοινότητα από τους παλαιότερους αγοραστές.
Στο παράδειγμα των μισθών διαχείρισης, ας υποθέσουμε ότι υπήρχε ένας εξωγήινος που είχε μικρότερο προϋπολογισμό, λιγότερη αρχαιότητα και με λιγότερο προσωπικό για διαχείριση, αλλά έκανε περισσότερα από οποιονδήποτε άλλο. Ο Υπεύθυνος Ανθρώπινου Δυναμικού θα μπορούσε να εξετάσει τα δεδομένα και να καταλήξει στο συμπέρασμα ότι αυτό το άτομο πληρώνεται υπερβολικά. Ωστόσο, αυτό το συμπέρασμα θα ήταν λανθασμένο εάν δεν έλαβε υπόψη ότι αυτός ο διευθυντής ήταν υπεύθυνος για τον ιστότοπο της εταιρείας και είχε ένα πολύ πολυπόθητο σετ δεξιοτήτων στην ασφάλεια του δικτύου.