Doğrusal regresyon, şu şekilde belirtilen bağımlı bir değişken arasındaki ilişkiyi incelemek için istatistiksel bir yöntemdir. y, ve olarak belirtilen bir veya daha fazla bağımsız değişken x. Bağımlı değişken, herhangi bir değer alabilmesi veya en azından sürekliye yakın olması için sürekli olmalıdır. Bağımsız değişkenler herhangi bir tipte olabilir. Doğrusal regresyon tek başına nedensellik gösteremese de, bağımlı değişken genellikle bağımsız değişkenlerden etkilenir.
Doğrusal Regresyon Doğrusal İlişkilerle Sınırlıdır
Doğası gereği, doğrusal regresyon yalnızca bağımlı ve bağımsız değişkenler arasındaki doğrusal ilişkilere bakar. Yani aralarında doğrusal bir ilişki olduğunu varsayar. Bazen bu yanlıştır. Örneğin, gelir ve yaş arasındaki ilişki eğridir, yani gelir yetişkinliğin erken dönemlerinde yükselme, daha sonraki yetişkinlik döneminde düzleşme ve insanlar emekli olduktan sonra düşme eğilimindedir. İlişkilerin grafiksel temsillerine bakarak bunun bir sorun olup olmadığını anlayabilirsiniz.
Doğrusal Regresyon Sadece Bağımlı Değişkenin Ortalamasına Bakar
Doğrusal regresyon, bağımlı değişkenin ortalaması ile bağımsız değişkenler arasındaki ilişkiye bakar. Örneğin, bebeklerin doğum ağırlığı ile annenin doğum ağırlığı arasındaki ilişkiye bakarsanız yaş, doğrusal regresyon gibi özellikler, annelerinden doğan bebeklerin ortalama ağırlığına bakacaktır. farklı Çağlar. Ancak bazen bağımlı değişkenin uç noktalarına bakmanız gerekir, örneğin bebekler kiloları düşükken risk altındadır, bu nedenle bu örnekte uç noktalara bakmak istersiniz.
Ortalamanın tek bir değişkenin tam açıklaması olmadığı gibi, doğrusal regresyon da değişkenler arasındaki ilişkilerin tam bir açıklaması değildir. Kuantil regresyon kullanarak bu sorunu çözebilirsiniz.
Doğrusal Regresyon Aykırı Değerlere Duyarlıdır
Aykırı değerler şaşırtıcı olan verilerdir. Aykırı değerler tek değişkenli (bir değişkene dayalı) veya çok değişkenli olabilir. Yaşa ve gelire bakıyorsanız, tek değişkenli aykırı değerler, 118 yaşında veya geçen yıl 12 milyon dolar kazanan biri gibi şeyler olacaktır. Çok değişkenli bir aykırı değer, 200.000 dolar kazanan 18 yaşındaki bir kişi olacaktır. Bu durumda ne yaş ne de gelir çok uç noktalarda ama çok az sayıda 18 yaşındaki insan bu kadar para kazanıyor.
Aykırı değerlerin regresyon üzerinde büyük etkileri olabilir. İstatistik yazılımınızdan etki istatistikleri talep ederek bu sorunu çözebilirsiniz.
Veriler Bağımsız Olmalı
Doğrusal regresyon, verilerin bağımsız olduğunu varsayar. Bu, bir konunun puanlarının (bir kişi gibi) diğerinin puanlarıyla hiçbir ilgisi olmadığı anlamına gelir. Bu genellikle, ancak her zaman değil, mantıklıdır. Mantıklı olmadığı iki yaygın durum, uzay ve zamanda kümelenmedir.
Uzayda kümelenmenin klasik bir örneği, çeşitli sınıflardan, sınıflardan, okullardan ve okul bölgelerinden öğrencileriniz olduğunda öğrenci test puanlarıdır. Aynı sınıftaki öğrenciler birçok yönden benzer olma eğilimindedir, yani genellikle aynı mahallelerden gelirler, aynı öğretmenlere sahiptirler, vb. Dolayısıyla bağımsız değillerdir.
Zaman içinde kümeleme örnekleri, aynı konuları birden çok kez ölçtüğünüz çalışmalardır. Örneğin, bir diyet ve kilo çalışmasında, her bir kişiyi birden çok kez ölçebilirsiniz. Bu veriler bağımsız değildir, çünkü bir kişinin bir durumdaki ağırlığı, diğer durumlardaki ağırlığıyla ilişkilidir. Bununla başa çıkmanın bir yolu çok seviyeli modellerdir.