Mane linearne regresije

Linearna regresija statistička je metoda za ispitivanje odnosa između ovisne varijable, označena kao y, i jedna ili više neovisnih varijabli, označenih kao x. Ovisna varijabla mora biti kontinuirana, tako da može poprimiti bilo koju vrijednost, ili barem blizu kontinuiranoj. Nezavisne varijable mogu biti bilo koje vrste. Iako linearna regresija ne može sama pokazati uzročnost, na ovisnu varijablu obično utječu neovisne varijable.

Linearna regresija ograničena je na linearne odnose

Po svojoj prirodi linearna regresija promatra samo linearne odnose između ovisnih i neovisnih varijabli. Odnosno, pretpostavlja se da između njih postoji linearni odnos. Ponekad je to netočno. Primjerice, veza između dohotka i dobi zakrivljena je, tj. Dohodak raste u ranim dijelovima odrasle dobi, poravnava se u kasnijoj odrasloj dobi i opada nakon što se ljudi povuku. Možete li utvrditi je li to problem gledajući grafičke prikaze odnosa.

Linearna regresija promatra samo sredinu ovisne varijable

Linearna regresija promatra odnos između sredine ovisne varijable i neovisnih varijabli. Na primjer, ako pogledate vezu između porođajne težine novorođenčadi i majke Karakteristike kao što su dob, linearna regresija gledat će na prosječnu težinu beba rođenih od majki različite dobi. Međutim, ponekad trebate pogledati krajnosti ovisne varijable, npr. Bebe su u opasnosti kad su njihove težine male, pa biste u ovom primjeru željeli pogledati krajnosti.

instagram story viewer

Kao što srednja vrijednost nije cjelovit opis pojedine varijable, linearna regresija nije cjelovit opis odnosa među varijablama. Pomoću kvantilne regresije možete se nositi s tim problemom.

Linearna regresija osjetljiva je na izvanredne vrijednosti

Outliers su podaci koji iznenađuju. Izuzeci mogu biti jednovarijantni (na temelju jedne varijable) ili multivarijatni. Ako gledate dob i prihode, univarijantni outliers bili bi stvari poput osobe koja ima 118 godina ili one koja je prošle godine zaradila 12 milijuna dolara. Multivarijantni outlier bio bi 18-godišnjak koji je zaradio 200 000 USD. U ovom slučaju, ni dob ni prihod nisu vrlo ekstremni, ali vrlo malo 18-godišnjaka zarađuje toliko novca.

Izuzeci mogu imati ogromne učinke na regresiju. Možete se nositi s tim problemom tako što ćete zatražiti statistiku utjecaja od svog statističkog softvera.

Podaci moraju biti neovisni

Linearna regresija pretpostavlja da su podaci neovisni. To znači da partiture jednog predmeta (kao što je osoba) nemaju nikakve veze s rezultatima drugog. To je često, ali ne uvijek, razumno. Dva česta slučaja kada to nema smisla su klasterizacija u prostoru i vremenu.

Klasičan primjer klasteriranja u svemiru su ocjene učenika, kada imate učenike iz različitih razreda, razreda, škola i školskih okruga. Učenici u istom razredu u mnogim su slučajevima slični, tj. Često dolaze iz istih četvrti, imaju iste učitelje itd. Dakle, nisu neovisni.

Primjeri grupiranja u vremenu su bilo koje studije u kojima mjerite iste predmete više puta. Na primjer, u istraživanju prehrane i težine, svaku biste osobu mogli mjeriti više puta. Ti podaci nisu neovisni jer je ono što osoba teži jednom prilikom povezano s onim što važi u drugim prilikama. Jedan od načina da se to riješi je višerazinski model.

Teachs.ru
  • Udio
instagram viewer