Multipel regression används för att undersöka sambandet mellan flera oberoende variabler och en beroende variabel. Medan flera regressionsmodeller låter dig analysera de relativa influenserna av dessa oberoende eller prediktiva variabler på beroende på, eller kriterium, variabel, kan dessa ofta komplexa datamängder leda till falska slutsatser om de inte analyseras ordentligt.
Exempel på multipel regression
En fastighetsmäklare kan använda multipel regression för att analysera värdet på husen. Till exempel kunde hon använda som oberoende variabler husens storlek, deras ålder, antalet sovrum, det genomsnittliga bostadspriset i grannskapet och närheten till skolor. Genom att planera dessa i en multipel regressionsmodell kunde hon sedan använda dessa faktorer för att se deras förhållande till bostadspriserna som kriterievariabel.
Ett annat exempel på att använda en multipel regressionsmodell kan vara någon i personalresurser som bestämmer lönen för ledande befattningar - kriterievariabeln. Prediktorvariablerna kan vara varje chefs anciennitet, det genomsnittliga antalet arbetade timmar, antalet personer som hanteras och chefens avdelningsbudget.
Fördelar med multipel regression
Det finns två huvudsakliga fördelar med att analysera data med hjälp av en multipel regressionsmodell. Den första är förmågan att bestämma det relativa inflytandet av en eller flera prediktorvariabler till kriterievärdet. Fastighetsmäklaren kunde finna att storleken på bostäderna och antalet sovrum har en stark korrelation med priset på en hem, medan närheten till skolor inte har någon korrelation alls, eller till och med en negativ korrelation om det i första hand är pension gemenskap.
Den andra fördelen är förmågan att identifiera avvikare eller avvikelser. Till exempel, när man granskar data relaterade till ledningslöner, kunde personalchefen upptäcka att antalet arbetade timmar, avdelningens storlek och dess budget hade alla en stark korrelation med lönerna, medan ancienniteten gjorde inte. Alternativt kan det vara så att alla listade prediktorvärden var korrelerade till var och en av de löner som undersöktes, förutom en chef som var för mycket betald jämfört med de andra.
Nackdelar med multipel regression
Nackdelarna med att använda en multipel regressionsmodell beror vanligtvis på den data som används. Två exempel på detta är att använda ofullständiga data och felaktigt dra slutsatsen att en korrelation är en orsakssamband.
Om du till exempel granskar bostadspriserna, antar att fastighetsmäklaren bara tittade på 10 bostäder, varav sju köptes av unga föräldrar. I det här fallet kan förhållandet mellan skolans närhet få henne att tro att detta hade en effekt på försäljningspriset för alla bostäder som säljs i samhället. Detta illustrerar fallgroparna med ofullständig data. Hade hon använt ett större urval kunde hon ha upptäckt att av 100 sålda bostäder var det bara tio procent av hemvärdena som var relaterade till skolans närhet. Om hon hade använt köparnas åldrar som ett prediktorvärde, kunde hon ha upptäckt att yngre köpare var villiga att betala mer för bostäder i samhället än äldre köpare.
I exemplet med ledningslöner, antar att det fanns en avvikare som hade en mindre budget, mindre tjänsteår och med färre personal att hantera men tjänade mer än någon annan. HR-chefen kunde titta på uppgifterna och dra slutsatsen att den här personen betalas för mycket. Denna slutsats skulle dock vara felaktig om han inte tog hänsyn till att den här chefen var ansvarig för företagets webbplats och hade en mycket eftertraktad kompetens inom nätverkssäkerhet.