Переваги та недоліки моделі множинної регресії

Множинна регресія використовується для вивчення зв'язку між кількома незалежними змінними та залежною змінною. Хоча моделі множинної регресії дозволяють проаналізувати відносний вплив цих незалежних змінних чи змінних залежна, або критеріальна змінна, ці часто складні набори даних можуть призвести до хибних висновків, якщо їх не проаналізувати належним чином.

Приклади множинної регресії

Агент з нерухомості може використовувати багаторазову регресію для аналізу вартості будинків. Наприклад, вона могла б використовувати як незалежні змінні розмір будинків, їх вік, кількість спалень, середню ціну житла в районі та близькість до шкіл. Побудувавши їх у моделі множинної регресії, вона потім могла використовувати ці фактори, щоб побачити їх зв’язок із цінами будинків як змінну критерію.

Іншим прикладом використання моделі множинної регресії може бути хтось у кадрових ресурсах, який визначає заробітну плату на керівних посадах - критеріальна змінна. Змінними предикторами можуть бути стаж кожного керівника, середня кількість відпрацьованих годин, кількість людей, якими керують, та бюджет відділу керівника.

Переваги множинної регресії

Є дві основні переваги аналізу даних за допомогою моделі множинної регресії. Перший - це здатність визначати відносний вплив однієї або декількох змінних-предикторів на значення критерію. Агент з нерухомості міг виявити, що розмір будинків та кількість спалень суттєво корелюють із ціною квартири вдома, тоді як близькість до шкіл взагалі не має кореляції або навіть негативної кореляції, якщо це в першу чергу вихід на пенсію громада.

Друга перевага - це здатність ідентифікувати відхилення або аномалії. Наприклад, переглядаючи дані, що стосуються заробітної плати керівника, менеджер з управління персоналом міг виявити, що кількість відпрацьованих годин, розмір відділу та його бюджет мали суттєву кореляцію із зарплатою, тоді як стаж працював ні. В якості альтернативи, може бути, що всі перераховані величини прогнозу були співвіднесені з кожною з окладів, що перевіряються, за винятком одного менеджера, якому було надмірно заплачено порівняно з іншими.

Недоліки множинної регресії

Будь-який недолік використання моделі множинної регресії, як правило, зводиться до даних, що використовуються. Два приклади цього - використання неповних даних та помилковий висновок, що кореляція є причинно-наслідковим зв’язком.

Наприклад, переглядаючи ціну будинків, припустимо, агент з нерухомості розглянув лише 10 будинків, сім з яких придбали молоді батьки. У цьому випадку взаємозв'язок близькості шкіл може змусити її думати, що це вплинуло на ціну продажу всіх будинків, що продаються в громаді. Це ілюструє підводні камені неповних даних. Якби вона використовувала більшу вибірку, вона могла б виявити, що із 100 проданих будинків лише десять відсотків цінностей будинків були пов’язані з близькістю школи. Якби вона використовувала вік покупців як прогностичну величину, вона могла б виявити, що молодші покупці готові платити більше за будинки в громаді, ніж старші покупці.

У прикладі зарплати керівництву, припустимо, був хтось із тих, хто мав менший бюджет, менший стаж та меншу кількість персоналу для управління, але заробляв більше, ніж хтось інший. Менеджер з персоналу міг би переглянути дані і дійти висновку, що цій особі переплачують. Однак цей висновок був би помилковим, якби він не врахував, що цей менеджер відповідав за веб-сайт компанії і мав дуже бажаний набір навичок у галузі мережевої безпеки.

  • Поділитися
instagram viewer