Slabosti linearne regresije

Linearna regresija je statistična metoda za preučevanje razmerja med odvisno spremenljivko, označeno z y, in eno ali več neodvisnih spremenljivk, označenih z x. Odvisna spremenljivka mora biti neprekinjena, tako da lahko dobi katero koli vrednost ali vsaj blizu neprekinjene. Neodvisne spremenljivke so lahko katere koli vrste. Čeprav linearna regresija ne more sama pokazati vzročne zveze, na neodvisno spremenljivko običajno vplivajo neodvisne spremenljivke.

Linearna regresija je omejena na linearne odnose

Linearna regresija po svoji naravi gleda samo na linearna razmerja med odvisnimi in neodvisnimi spremenljivkami. To pomeni, da predpostavlja, da med njima obstaja enakomerno razmerje. Včasih je to napačno. Na primer, razmerje med dohodkom in starostjo je ukrivljeno, tj. Dohodek se v zgodnjih delih odraslosti večinoma povečuje, v poznejši odraslosti zravna in po upokojitvi upada. Če je to težava, lahko ugotovite, če si ogledate grafične predstavitve odnosov.

Linearna regresija gleda samo na sredino odvisne spremenljivke

instagram story viewer

Linearna regresija obravnava razmerje med sredino odvisne spremenljivke in neodvisnimi spremenljivkami. Na primer, če pogledate razmerje med porodno težo dojenčkov in mater značilnosti, kot so starost, linearna regresija, bodo upoštevale povprečno težo dojenčkov, rojenih materam različnih starosti. Vendar včasih morate pogledati skrajnosti odvisne spremenljivke, na primer dojenčki so ogroženi, ko je njihova teža majhna, zato bi si v tem primeru želeli ogledati skrajnosti.

Tako kot srednja vrednost ni popoln opis posamezne spremenljivke, linearna regresija ni popoln opis odnosov med spremenljivkami. S to težavo se lahko spoprimete z uporabo kvantilne regresije.

Linearna regresija je občutljiva na izstopajoče

Izstopajoči podatki so presenetljivi. Izstopajoči so lahko enopremenljivi (na podlagi ene spremenljivke) ali večvariatni. Če gledate na starost in dohodek, bi bili nespremenljivi odstopanja stvari, kot je oseba, stara 118 let, ali oseba, ki je lani zaslužila 12 milijonov dolarjev. Večvariacijski odstopalec bi bil 18-letnik, ki je zaslužil 200.000 dolarjev. V tem primeru niti starost niti dohodek nista zelo skrajna, a le malo 18-letnikov zasluži toliko denarja.

Izstopajoči lahko močno vplivajo na regresijo. S to težavo se lahko spoprimete tako, da od svoje statistične programske opreme zahtevate statistične podatke o vplivu.

Podatki morajo biti neodvisni

Linearna regresija predpostavlja, da so podatki neodvisni. To pomeni, da partiture enega predmeta (na primer osebe) nimajo nobene zveze z rezultati drugega. To je pogosto, vendar ne vedno, smiselno. Dva pogosta primera, ko to nima smisla, sta združevanje v prostor in čas.

Klasičen primer združevanja v vesolje so ocene študentov, ko imate učence iz različnih razredov, razredov, šol in šolskih okolišev. Učenci v istem razredu so si v mnogih pogledih podobni, tj. Pogosto prihajajo iz istih sosesk, imajo iste učitelje itd. Tako niso neodvisni.

Primeri grozdenja v času so katere koli študije, pri katerih iste predmete merite večkrat. Na primer, v študiji prehrane in teže lahko vsako osebo izmerite večkrat. Ti podatki niso neodvisni, ker je tisto, kar oseba tehta ob eni priložnosti, povezano s tem, kar tehta ob drugih priložnostih. Eden od načinov za reševanje tega je večnivojski modeli.

Teachs.ru
  • Deliti
instagram viewer