Prednosti i nedostaci modela višestruke regresije

Višestruka regresija koristi se za ispitivanje odnosa između nekoliko neovisnih varijabli i ovisne varijable. Iako vam modeli višestruke regresije omogućuju analizu relativnih utjecaja ovih neovisnih varijabli ili varijabli prediktora zavisna varijabla ili kriterij, ovi često složeni skupovi podataka mogu dovesti do lažnih zaključaka ako se ne analiziraju pravilno.

Primjeri višestruke regresije

Agent za prodaju nekretnina mogao bi koristiti višestruku regresiju za analizu vrijednosti kuća. Na primjer, mogla bi koristiti kao nezavisne varijable veličinu kuća, njihovu dob, broj spavaćih soba, prosječnu cijenu kuće u susjedstvu i blizinu škola. Ucrtavajući ih u model višestruke regresije, ona bi tada mogla koristiti te čimbenike da vidi njihov odnos prema cijenama domova kao varijablu kriterija.

Još jedan primjer upotrebe modela višestruke regresije mogao bi biti netko u ljudskim resursima koji određuje plaću na rukovodećim mjestima - kriterijska varijabla. Varijable prediktora mogu biti radni staž svakog menadžera, prosječni broj odrađenih sati, broj ljudi kojima se upravlja i proračun odjela menadžera.

instagram story viewer

Prednosti višestruke regresije

Dvije su glavne prednosti analize podataka korištenjem modela višestruke regresije. Prva je sposobnost utvrđivanja relativnog utjecaja jedne ili više prediktorskih varijabli na vrijednost kriterija. Agent za promet nekretninama mogao bi otkriti da veličina domova i broj spavaćih soba imaju snažnu korelaciju s cijenom kuće kući, dok blizina škola uopće nema korelacije, pa čak ni negativnu korelaciju ako je to prvenstveno umirovljenje zajednica.

Druga prednost je sposobnost identificiranja odstupanja ili anomalija. Na primjer, dok je pregledavao podatke koji se odnose na menadžerske plaće, menadžer ljudskih resursa mogao bi otkriti da broj odrađenih sati, veličina odjela i njegov proračun imali su snažnu korelaciju s plaćama, dok je staž imao ne. Alternativno, može biti da su sve navedene vrijednosti prediktora povezane sa svakom od plaća koje se ispituju, osim za jednog menadžera koji je bio preplaćen u usporedbi s ostalima.

Mane višestruke regresije

Svaki nedostatak upotrebe modela višestruke regresije obično se svodi na podatke koji se koriste. Dva primjera za to su korištenje nepotpunih podataka i lažni zaključak da je korelacija uzročno-posljedična.

Na primjer, pregledavajući cijenu domova, pretpostavimo da je agent za promet nekretnina pogledao samo 10 domova, od kojih su sedam kupili mladi roditelji. U ovom slučaju, odnos između blizine škola može je navesti da vjeruje da je to utjecalo na prodajnu cijenu svih domova koji se prodaju u zajednici. To ilustrira zamke nepotpunih podataka. Da je koristila veći uzorak, mogla bi otkriti da se od 100 prodanih domova samo deset posto vrijednosti domova odnosilo na blizinu škole. Da je koristila dob kupaca kao vrijednost prediktora, mogla bi otkriti da su mlađi kupci spremni platiti domove u zajednici više od starijih kupaca.

U primjeru menadžerskih plaća, pretpostavimo da je postojao jedan vanzemaljac koji je imao manji proračun, manje radnog staža i s manje osoblja za upravljanje, ali je zarađivao više od svih ostalih. HR menadžer mogao bi pogledati podatke i zaključiti da se toj osobi preplaćuje. Međutim, ovaj bi zaključak bio pogrešan ako ne uzme u obzir da je ovaj upravitelj bio zadužen za web stranicu tvrtke i da je imao vrlo željeni skup vještina u mrežnoj sigurnosti.

Teachs.ru
  • Udio
instagram viewer