Линеарна регресија је статистичка метода за испитивање односа између зависне променљиве која се означава као и, и једна или више независних променљивих, означених као Икс. Зависна променљива мора бити континуирана, тако да може попримити било коју вредност, или бар близу континуираној. Независне променљиве могу бити било које врсте. Иако линеарна регресија не може сама показати узрочност, на зависну променљиву обично утичу независне променљиве.
Линеарна регресија ограничена је на линеарне односе
По својој природи линеарна регресија посматра само линеарне односе између зависних и независних променљивих. Односно, претпоставља се да постоји праволинијски однос између њих. Понекад је ово нетачно. На пример, веза између дохотка и старости је закривљена, тј. Доходак расте у раним деловима зрелости, поравнава се у каснијој зрелости и опада након што се људи пензионишу. Да ли је ово проблем можете утврдити гледајући графичке приказе односа.
Линеарна регресија посматра само средину зависне променљиве
Линеарна регресија посматра однос између средине зависне променљиве и независних променљивих. На пример, ако погледате везу између порођајне тежине новорођенчади и мајке карактеристике као што су старост, линеарна регресија гледаће на просечну тежину беба рођених од мајки различите старости. Међутим, понекад морате да погледате крајности зависне променљиве, на пример, бебе су у ризику када им је тежина мала, па бисте желели да погледате крајности у овом примеру.
Као што средња вредност није потпун опис поједине променљиве, линеарна регресија није потпун опис односа међу променљивим. Помоћу квантилне регресије можете се носити са овим проблемом.
Линеарна регресија осетљива је на изванредне вредности
Изузеци су подаци који изненађују. Изузеци могу бити једноваријантни (на основу једне променљиве) или мултиваријантни. Ако гледате старост и приход, униваријантни оутлиерс би били ствари попут особе која има 118 година или оне која је прошле године зарадила 12 милиона долара. Мултиваријантни оутлиер био би 18-годишњак који је зарадио 200 000 УСД. У овом случају, ни старост ни приход нису врло екстремни, али врло мало 18-годишњака зарађује толико новца.
Изузеци могу имати огромне ефекте на регресију. Са овим проблемом можете се позабавити захтевањем статистике утицаја од свог статистичког софтвера.
Подаци морају бити независни
Линеарна регресија претпоставља да су подаци независни. То значи да партитуре једног предмета (као што је особа) немају никакве везе са резултатима другог. То је често, али не увек, разумно. Два честа случаја када то нема смисла су кластерисање у простору и времену.
Класичан пример груписања у свемиру су резултати тестова ученика када имате ученике из различитих одељења, разреда, школа и школских округа. Ученици у истом одељењу имају тенденцију да буду слични у много чему, тј. Често долазе из истих четврти, имају исте наставнике итд. Дакле, они нису независни.
Примери груписања у времену су било које студије у којима се исти предмети мере више пута. На пример, у студији о исхрани и тежини, могли бисте да мерите сваку особу више пута. Ови подаци нису независни, јер је оно што особа тежи једном приликом повезано са оним што тежи у другим приликама. Један од начина да се ово реши је вишеразински модел.