Lineaarisen regression haitat

Lineaarinen regressio on tilastollinen menetelmä riippuvan muuttujan välisen suhteen tutkimiseksi y, ja yksi tai useampi riippumaton muuttuja, merkitty nimellä x. Riippuvan muuttujan on oltava jatkuva siten, että se voi saada minkä tahansa arvon tai ainakin lähellä jatkuvaa. Riippumattomat muuttujat voivat olla minkä tahansa tyyppisiä. Vaikka lineaarinen regressio ei pysty osoittamaan syy-yhteyttä itsestään, riippumattomat muuttujat vaikuttavat yleensä riippumattomiin muuttujiin.

Lineaarinen regressio rajoittuu lineaarisiin suhteisiin

Luonnollisesti lineaarinen regressio tarkastelee vain riippuvien ja riippumattomien muuttujien välisiä lineaarisia suhteita. Eli oletetaan, että niiden välillä on suora suhde. Joskus tämä on väärin. Esimerkiksi tulojen ja iän välinen suhde on kaareva, ts. Tuloilla on taipumus kasvaa aikuisiän alkuvaiheissa, tasaantua myöhemmässä aikuisuudessa ja laskea ihmisten eläkkeelle siirtymisen jälkeen. Voit selvittää, onko tämä ongelma, tarkastelemalla suhteiden graafisia esityksiä.

instagram story viewer

Lineaarinen regressio tarkastelee vain riippuvan muuttujan keskiarvoa

Lineaarinen regressio tarkastelee riippuvan muuttujan keskiarvon ja riippumattomien muuttujien välistä suhdetta. Esimerkiksi, jos tarkastellaan imeväisten syntymäpainon ja äidin suhdetta ominaisuudet, kuten ikä, lineaarinen regressio tarkastelevat äitien syntyneiden vauvojen keskipainoa eri ikäisiä. Joskus sinun on kuitenkin tarkasteltava riippuvaisen muuttujan ääripäitä, esimerkiksi vauvat ovat vaarassa, kun heidän painonsa ovat alhaiset, joten haluat tarkastella tässä esimerkissä olevia ääripäitä.

Aivan kuten keskiarvo ei ole yhden muuttujan täydellinen kuvaus, lineaarinen regressio ei ole täydellinen kuvaus muuttujien välisistä suhteista. Voit käsitellä tätä ongelmaa käyttämällä kvantiilin regressiota.

Lineaarinen regressio on herkkä poikkeamille

Poikkeamat ovat yllättäviä tietoja. Poikkeamat voivat olla yksi- tai usean muuttujan. Jos tarkastelet ikää ja tuloja, yksivaiheiset poikkeamat ovat asioita, kuten henkilö, joka on 118-vuotias tai joka teki 12 miljoonaa dollaria viime vuonna. Monimuuttuja olisi 18-vuotias, joka ansaitsi 200 000 dollaria. Tässä tapauksessa ikä ja tulot eivät ole kovin äärimmäisiä, mutta vain harvat 18-vuotiaat ihmiset ansaitsevat niin paljon rahaa.

Poikkeuksilla voi olla valtavia vaikutuksia regressioon. Voit ratkaista tämän ongelman pyytämällä vaikutustilastoja tilasto-ohjelmistoltasi.

Datan on oltava riippumaton

Lineaarinen regressio olettaa, että tiedot ovat riippumattomia. Tämä tarkoittaa, että yhden kohteen (kuten henkilön) pisteillä ei ole mitään tekemistä toisen kanssa. Tämä on usein, mutta ei aina, järkevää. Kaksi yleistä tapausta, joissa sillä ei ole järkeä, ovat ryhmittymiä tilassa ja ajassa.

Klassinen esimerkki avaruusryhmittymästä on opiskelijoiden testitulokset, kun sinulla on opiskelijoita eri luokista, luokista, kouluista ja koulupiireistä. Saman luokan opiskelijat ovat yleensä samankaltaisia ​​monin tavoin, toisin sanoen he tulevat usein samasta kaupunginosasta, heillä on samat opettajat jne. Siksi he eivät ole riippumattomia.

Esimerkkejä klustereista ajassa ovat kaikki tutkimukset, joissa mitataan samoja aiheita useita kertoja. Esimerkiksi ruokavalion ja painon tutkimuksessa saatat mitata jokaista ihmistä useita kertoja. Nämä tiedot eivät ole riippumattomia, koska se, mitä henkilö painaa yhdessä yhteydessä, liittyy siihen, mitä hän painaa muissa tilanteissa. Yksi tapa käsitellä tätä on monitasoiset mallit.

Teachs.ru
  • Jaa
instagram viewer