Lineaarse regressiooni puudused

Lineaarne regressioon on statistiline meetod sõltuva muutuja vahelise seose uurimiseks, mida tähistatakse kui y, ja üks või mitu sõltumatut muutujat, mida tähistatakse kui x. Sõltuv muutuja peab olema pidev, nii et see võib omandada mis tahes väärtuse või vähemalt pideva lähedane. Sõltumatud muutujad võivad olla mis tahes tüüpi. Kuigi lineaarne regressioon ei saa iseenesest põhjuslikku seost näidata, mõjutavad sõltuvat muutujat tavaliselt sõltumatud muutujad.

Lineaarne regressioon piirdub lineaarsete suhetega

Oma olemuselt vaatleb lineaarne regressioon ainult lineaarseid seoseid sõltuvate ja sõltumatute muutujate vahel. See tähendab, et eeldatakse, et nende vahel on sirgjooneline suhe. Mõnikord on see vale. Näiteks on sissetuleku ja vanuse suhe kõver, s.t sissetulek kipub täiskasvanuks saamise alguses kasvama, hilisemas täiskasvanueas tasaseks ja pärast inimeste pensionile jäämist vähenema. Seoste graafiliste esituste abil saate teada, kas see on probleem.

Lineaarne regressioon vaatleb ainult sõltuva muutuja keskmist

instagram story viewer

Lineaarne regressioon vaatleb suhet sõltuva muutuja keskmise ja sõltumatute muutujate vahel. Näiteks kui vaadata imikute sünnikaalu ja ema suhet selliste omaduste nagu vanus, lineaarne taandareng vaatavad ema emade sündide keskmise kaalu erinevas vanuses. Kuid mõnikord peate vaatama sõltuva muutuja äärmusi, näiteks on beebid ohustatud, kui nende kaal on väike, nii et soovite vaadata selles näites äärmusi.

Nii nagu keskmine ei ole ühe muutuja täielik kirjeldus, pole ka lineaarne regressioon muutujate vaheliste seoste täielik kirjeldus. Selle probleemiga saate toime tulla kvantiili regressiooni abil.

Lineaarne regressioon on tundlik kõrvalseisjate suhtes

Kõrvalekalded on üllatavad andmed. Võõrväärtused võivad olla ühemuutujad (ühe muutuja põhjal) või mitmemuutujad. Kui vaatate vanust ja sissetulekut, oleksid ühemõõtmelised kõrvalekalded näiteks 118-aastane inimene või eelmisel aastal 12 miljonit dollarit teeninud inimene. Mitmemõõtmeline kõrvalekalle oleks 18-aastane, kes teenis 200 000 dollarit. Sel juhul ei ole vanus ega sissetulek väga ekstreemsed, kuid väga vähesed 18-aastased inimesed teenivad nii palju raha.

Kõrvalseisudel võib olla regressioonile tohutu mõju. Selle probleemiga saate toime tulla, küsides statistikatarkvarast mõju statistikat.

Andmed peavad olema sõltumatud

Lineaarne regressioon eeldab, et andmed on sõltumatud. See tähendab, et ühe õppeaine (näiteks inimese) hinded ei ole kuidagi seotud teise omaga. See on sageli, kuid mitte alati, mõistlik. Kaks levinud juhtumit, kus pole mõtet, on rühmitatud ruumis ja ajas.

Klassikaline näide kosmoses klasterdamisest on õpilaste testitulemused, kui teil on õpilasi erinevatest klassidest, klassidest, koolidest ja koolipiirkondadest. Sama klassi õpilased kipuvad olema mitmes mõttes sarnased, s.t nad on sageli pärit samadest linnaosadest, neil on samad õpetajad jne. Seega pole nad iseseisvad.

Ajalise rühmitamise näited on kõik uuringud, kus mõõdate samu aineid mitu korda. Näiteks dieedi ja kehakaalu uurimisel võite mõõta iga inimest mitu korda. Need andmed ei ole sõltumatud, sest see, mida inimene ühel korral kaalub, on seotud sellega, mida ta kaalub teistel kordadel. Üks võimalus sellega toime tulla on mitmetasandiliste mudelitega.

Teachs.ru
  • Jaga
instagram viewer