Výhody a nevýhody modelu viacnásobnej regresie

Viacnásobná regresia sa používa na preskúmanie vzťahu medzi niekoľkými nezávislými premennými a závislou premennou. Zatiaľ čo viacnásobné regresné modely vám umožňujú analyzovať relatívne vplyvy týchto nezávislých alebo predikčných premenných na závislá alebo premenná kritéria, tieto často zložité súbory údajov môžu viesť k nesprávnym záverom, ak sa neanalyzujú správne.

Príklady viacnásobnej regresie

Realitný agent mohol na analýzu hodnoty domov použiť viacnásobnú regresiu. Ako nezávislé premenné mohla napríklad použiť veľkosť domov, ich vek, počet spální, priemernú cenu domu v susedstve a blízkosť škôl. Pri ich vykreslení do modelu viacnásobnej regresie by potom mohla pomocou týchto faktorov vidieť ich vzťah k cenám domov ako premennú kritéria.

Ďalším príkladom použitia modelu viacnásobnej regresie môže byť niekto, kto v oblasti ľudských zdrojov určuje plat riadiacich pozícií - premenná kritéria. Premennými prediktorov môžu byť odpracované roky každého manažéra, priemerný počet odpracovaných hodín, počet riadených ľudí a rozpočet manažéra na oddelenie.

Výhody viacnásobnej regresie

Existujú dve hlavné výhody analýzy údajov pomocou modelu viacnásobnej regresie. Prvou je schopnosť určiť relatívny vplyv jednej alebo viacerých predikčných premenných na hodnotu kritéria. Realitný agent mohol zistiť, že veľkosť domov a počet spální majú silnú koreláciu s cenou domu a doma, zatiaľ čo blízkosť škôl nemá vôbec žiadnu koreláciu, ba dokonca ani negatívnu koreláciu, ak ide primárne o dôchodok komunita.

Druhou výhodou je schopnosť identifikovať mimoriadne hodnoty alebo anomálie. Napríklad pri kontrole údajov týkajúcich sa platov riadenia môže manažér ľudských zdrojov zistiť, že: počet odpracovaných hodín, veľkosť oddelenia a jeho rozpočet mali silnú koreláciu s platmi, zatiaľ čo počet odpracovaných rokov áno nie. Prípadne by sa mohlo stať, že všetky uvedené hodnoty prediktorov korelovali s každým zo skúmaných platov, s výnimkou jedného manažéra, ktorému boli v porovnaní s ostatnými vyplatené preplatky.

Nevýhody viacnásobnej regresie

Akákoľvek nevýhoda použitia viacnásobného regresného modelu zvyčajne závisí od použitých údajov. Dva príklady sú použitie neúplných údajov a mylný záver, že korelácia je príčinou.

Napríklad pri kontrole ceny domov predpokladajme, že sa realitný agent pozrel iba na 10 domov, z ktorých sedem kúpili mladí rodičia. V takom prípade ju vzťah medzi blízkosťou škôl môže viesť k presvedčeniu, že to malo vplyv na predajnú cenu všetkých domov predávaných v komunite. To ilustruje úskalia neúplných údajov. Keby použila väčšiu vzorku, mohla by zistiť, že zo 100 predaných domov iba desať percent domácich hodnôt súvisí s blízkosťou školy. Keby použila vek kupujúcich ako predikčnú hodnotu, mohla by zistiť, že mladší kupujúci sú ochotní platiť za domácnosti v komunite viac ako starší kupujúci.

V príklade platov manažmentu predpokladajme, že bol jeden odľahlý zamestnanec, ktorý mal menší rozpočet, menej odpracovaných rokov a mal menej personálu na správu, ale zarábal viac ako ktokoľvek iný. Personalista by si mohol tieto údaje pozrieť a dospieť k záveru, že tejto fyzickej osobe je preplácaná suma. Tento záver by však bol mylný, ak by nezobral do úvahy, že tento manažér mal na starosti webové stránky spoločnosti a mal veľmi žiadanú sadu zručností v oblasti zabezpečenia siete.

  • Zdieľam
instagram viewer