Lineārā regresija ir statistikas metode, lai pārbaudītu saistību starp atkarīgo mainīgo, kas apzīmēts kā y, un viens vai vairāki neatkarīgi mainīgie, kas apzīmēti kā x. Atkarīgajam mainīgajam jābūt nepārtrauktam, jo tas var iegūt jebkuru vērtību vai vismaz tuvu nepārtrauktam. Neatkarīgie mainīgie var būt jebkura veida. Lai gan lineārā regresija pati par sevi nevar parādīt cēloņsakarību, atkarīgo mainīgo parasti ietekmē neatkarīgi mainīgie.
Lineārā regresija aprobežojas ar lineārām attiecībām
Pēc savas būtības lineārā regresija aplūko tikai lineāras attiecības starp atkarīgajiem un neatkarīgajiem mainīgajiem. Tas nozīmē, ka tā pieņem, ka starp tām pastāv tiešas attiecības. Dažreiz tas ir nepareizi. Piemēram, attiecības starp ienākumiem un vecumu ir izliektas, t.i., ienākumiem ir tendence pieaugt agrīnā pieaugušā vecumā, izlīdzināties vēlākā pieaugušā vecumā un samazināties pēc cilvēku aiziešanas pensijā. Vai šī ir problēma, varat uzzināt, aplūkojot attiecību grafisko attēlojumu.
Tikai lineārajā regresijā tiek aplūkots atkarīgā mainīgā vidējais lielums
Lineārā regresija aplūko saistību starp atkarīgā mainīgā vidējo un neatkarīgajiem mainīgajiem. Piemēram, ja paskatās uz saistību starp zīdaiņu un mātes dzimšanas svaru tādām pazīmēm kā vecums, lineārā regresija tiks aplūkots vidējais mazuļu svars, kas dzimuši dažādos vecumos. Tomēr dažreiz jums jāaplūko atkarīgā mainīgā galējības, piemēram, zīdaiņi ir pakļauti riskam, kad viņu svars ir mazs, tāpēc šajā piemērā vēlaties aplūkot galējības.
Tāpat kā vidējais rādītājs nav pilnīgs viena mainīgā apraksts, lineārā regresija nav pilnīgs attiecību raksturojums starp mainīgajiem. Jūs varat tikt galā ar šo problēmu, izmantojot kvantu regresiju.
Lineārā regresija ir jutīga pret ārējiem rādītājiem
Ārējie rādītāji ir pārsteidzoši dati. Ārējie varianti var būt vienmaļīgi (pamatojoties uz vienu mainīgo) vai daudzveidīgi. Ja skatāties uz vecumu un ienākumiem, vienvirziena izslēgtie rādītāji būtu tādas lietas kā persona, kurai ir 118 gadi, vai tāda, kas pagājušajā gadā nopelnīja 12 miljonus ASV dolāru. Vairāku mainīgo rādītājs būtu 18 gadus vecs jaunietis, kurš nopelnīja 200 000 USD. Šajā gadījumā ne vecums, ne ienākumi nav ļoti ekstremāli, taču ļoti maz 18 gadus vecu cilvēku nopelna tik daudz naudas.
Ārkārtējiem var būt milzīga ietekme uz regresiju. Jūs varat tikt galā ar šo problēmu, pieprasot ietekmes statistiku no savas statistikas programmatūras.
Datiem jābūt neatkarīgiem
Lineārā regresija pieņem, ka dati ir neatkarīgi. Tas nozīmē, ka viena priekšmeta (piemēram, personas) rādītājiem nav nekāda sakara ar citu. Tas bieži, bet ne vienmēr, ir saprātīgi. Divi izplatīti gadījumi, kad tam nav jēgas, ir kopas telpā un laikā.
Klasisks kopu kosmosā piemērs ir skolēnu pārbaudes rezultāti, kad jums ir skolēni no dažādām klasēm, klasēm, skolām un skolu rajoniem. Vienas klases skolēni mēdz būt daudzējādā ziņā līdzīgi, t.i., viņi bieži nāk no vienas un tās pašas apkaimes, viņiem ir vieni un tie paši skolotāji utt. Tādējādi viņi nav neatkarīgi.
Laika grupēšanas piemēri ir jebkuri pētījumi, kuros vienu un to pašu priekšmetu mēra vairākas reizes. Piemēram, pētot diētu un svaru, jūs katru reizi varat izmērīt vairākas reizes. Šie dati nav neatkarīgi, jo tas, ko cilvēks sver vienā reizē, ir saistīts ar to, ko viņš sver citos gadījumos. Viens no veidiem, kā to novērst, ir daudzlīmeņu modeļi.