Fordelene og ulempene med en multipel regresjonsmodell

Flere regresjoner brukes til å undersøke forholdet mellom flere uavhengige variabler og en avhengig variabel. Mens flere regresjonsmodeller lar deg analysere den relative innflytelsen til disse uavhengige, eller prediktoren, variablene på avhengig, eller kriterium, variabel, kan disse ofte komplekse datasettene føre til falske konklusjoner hvis de ikke blir analysert ordentlig.

Eksempler på flere regresjoner

En eiendomsmegler kunne bruke flere regresjoner for å analysere verdien av hus. For eksempel kunne hun bruke som uavhengige variabler størrelsen på husene, deres alder, antall soverom, den gjennomsnittlige boligprisen i nabolaget og nærheten til skolene. Ved å tegne disse i en multippel regresjonsmodell, kunne hun deretter bruke disse faktorene til å se deres forhold til boligprisene som kriterievariabel.

Et annet eksempel på bruk av en multippel regresjonsmodell kan være noen i menneskelige ressurser som bestemmer lønnen til lederstillinger - kriterievariabelen. Forutsigelsesvariablene kan være hver leder ansiennitet, gjennomsnittlig antall arbeidte timer, antall personer som administreres og lederens avdelingsbudsjett.

instagram story viewer

Fordeler med flere regresjoner

Det er to hovedfordeler ved å analysere data ved hjelp av en multippel regresjonsmodell. Den første er evnen til å bestemme den relative innflytelsen av en eller flere prediktorvariabler til kriterieverdien. Eiendomsmegleren kunne finne at størrelsen på boligene og antall soverom har en sterk sammenheng med prisen på en hjemme, mens nærheten til skolene ikke har noen sammenheng i det hele tatt, eller til og med en negativ sammenheng hvis det primært er pensjonisttilværelse samfunnet.

Den andre fordelen er evnen til å identifisere avvikere, eller avvik. For eksempel, mens man gjennomgår data relatert til ledelseslønn, kan personalansvarlig finne at antall arbeidte timer, avdelingsstørrelsen og budsjettet hadde en sterk sammenheng med lønn, mens ansiennitet gjorde det ikke. Alternativt kan det være at alle de oppførte prediktorverdiene var korrelert med hver av lønnene som ble undersøkt, bortsett fra en leder som ble betalt for mye i forhold til de andre.

Ulemper ved flere regresjoner

Enhver ulempe ved å bruke en multippel regresjonsmodell kommer vanligvis ned til dataene som brukes. To eksempler på dette er å bruke ufullstendige data og falsk konkludere med at en sammenheng er en årsakssammenheng.

Når du for eksempel vurderer prisen på boliger, antar at eiendomsmegleren bare så på 10 boliger, hvorav syv ble kjøpt av unge foreldre. I dette tilfellet kan forholdet mellom skolenes nærhet føre til at hun tror at dette hadde en effekt på salgsprisen for alle boliger som selges i samfunnet. Dette illustrerer fallgruvene med ufullstendige data. Hadde hun brukt et større utvalg, kunne hun ha funnet ut at av ti solgte boliger var det bare ti prosent av boligverdiene som var relatert til skolens nærhet. Hvis hun hadde brukt kjøpernes alder som en prediktorverdi, kunne hun ha funnet ut at yngre kjøpere var villige til å betale mer for boliger i samfunnet enn eldre kjøpere.

I eksemplet med ledelseslønn, anta at det var en outlier som hadde et mindre budsjett, mindre ansiennitet og med færre personell å administrere, men tjente mer enn noen annen. HR-sjefen kunne se på dataene og konkludere med at denne personen blir for mye betalt. Denne konklusjonen ville imidlertid være feil hvis han ikke tok i betraktning at denne lederen hadde ansvaret for selskapets nettside og hadde en meget ettertraktet dyktighet innen nettverkssikkerhet.

Teachs.ru
  • Dele
instagram viewer