Множествената регресия се използва за изследване на връзката между няколко независими променливи и зависима променлива. Докато множествените регресионни модели ви позволяват да анализирате относителното влияние на тези независими или предикторни променливи зависимата или критерийна променлива, тези често сложни набори от данни могат да доведат до неверни заключения, ако не бъдат анализирани правилно.
Примери за множествена регресия
Агентът за недвижими имоти може да използва многократна регресия, за да анализира стойността на къщите. Например тя би могла да използва като независими променливи размера на къщите, възрастта им, броя на спалните, средната цена на жилището в квартала и близостта до училищата. Като ги начертае в модел на множествена регресия, тя може след това да използва тези фактори, за да види връзката им с цените на домовете като критериална променлива.
Друг пример за използване на модел на множествена регресия може да бъде някой в човешките ресурси, определящ заплатата на ръководни длъжности - критериалната променлива. Прогнозните променливи могат да бъдат старшинството на всеки мениджър, средният брой отработени часове, броят на управляваните хора и департаментският бюджет на мениджъра.
Предимства на множествената регресия
Има две основни предимства при анализа на данни с помощта на модел на множествена регресия. Първият е способността да се определи относителното влияние на една или повече предикторски променливи върху стойността на критерия. Агентът по недвижими имоти би могъл да установи, че размерът на домовете и броят на спалните имат силна връзка с цената на вкъщи, докато близостта до училищата изобщо няма корелация или дори отрицателна връзка, ако това е предимно пенсиониране общност.
Второто предимство е способността да се идентифицират отклонения или аномалии. Например, докато преглежда данните, свързани с заплатите в управлението, мениджърът на човешките ресурси би могъл да открие, че броят на отработените часове, размерът на отдела и неговият бюджет имаха силна връзка с заплатите, докато стажът имаше не. Като алтернатива може да се окаже, че всички изброени предикторни стойности са свързани с всяка от изследваните заплати, с изключение на един мениджър, който е бил надплатен в сравнение с останалите.
Недостатъци на множествената регресия
Всеки недостатък на използването на модел на множествена регресия обикновено се свежда до използваните данни. Два примера за това са използване на непълни данни и невярно заключение, че корелацията е причинно-следствена връзка.
При прегледа на цената на домовете, например, да предположим, че агентът по недвижими имоти е разгледал само 10 жилища, седем от които са закупени от млади родители. В този случай връзката между близостта на училищата може да я накара да вярва, че това е повлияло на продажната цена за всички домове, продавани в общността. Това илюстрира клопките на непълните данни. Ако беше използвала по-голяма извадка, тя би могла да установи, че от 100 продадени домове само десет процента от стойностите на домовете са свързани с близостта на училище. Ако беше използвала възрастта на купувачите като предсказваща стойност, би могла да открие, че по-младите купувачи са готови да плащат повече за жилища в общността, отколкото по-възрастните купувачи.
Да предположим, че в примера с мениджърските заплати е имало един по-малък, който е имал по-малък бюджет, по-малък стаж и с по-малко персонал за управление, но е печелел повече от всеки друг. Мениджърът по човешки ресурси би могъл да разгледа данните и да заключи, че това лице е надплатено. Това заключение обаче би било погрешно, ако той не вземе предвид, че този мениджър отговаря за уебсайта на компанията и притежава силно желания набор от умения в мрежовата сигурност.