الانحدار الخطي هو طريقة إحصائية لفحص العلاقة بين المتغير التابع ، والمشار إليه بـ ذ ومتغير واحد أو أكثر من المتغيرات المستقلة ، يُشار إليها باسم x. يجب أن يكون المتغير التابع مستمرًا ، بحيث يمكن أن يأخذ أي قيمة ، أو على الأقل قريبًا من المتغير المستمر. يمكن أن تكون المتغيرات المستقلة من أي نوع. على الرغم من أن الانحدار الخطي لا يمكن أن يظهر السببية في حد ذاته ، إلا أن المتغير التابع يتأثر عادة بالمتغيرات المستقلة.
يقتصر الانحدار الخطي على العلاقات الخطية
بحكم طبيعته ، فإن الانحدار الخطي ينظر فقط إلى العلاقات الخطية بين المتغيرات التابعة والمستقلة. أي أنه يفترض وجود علاقة خط مستقيم بينهما. في بعض الأحيان هذا غير صحيح. على سبيل المثال ، العلاقة بين الدخل والعمر منحنية ، أي أن الدخل يميل إلى الارتفاع في الأجزاء الأولى من مرحلة البلوغ ، ويتسطح في مرحلة البلوغ المتأخرة وينخفض بعد تقاعد الناس. يمكنك معرفة ما إذا كانت هذه مشكلة بالنظر إلى التمثيلات الرسومية للعلاقات.
ينظر الانحدار الخطي فقط إلى متوسط المتغير التابع
يبحث الانحدار الخطي في العلاقة بين متوسط المتغير التابع والمتغيرات المستقلة. على سبيل المثال ، إذا نظرت إلى العلاقة بين وزن الطفل عند الولادة ووزن الأم خصائص مثل العمر والانحدار الخطي ستنظر في متوسط وزن الأطفال المولودين لأمهات أعمار مختلفة. ومع ذلك ، في بعض الأحيان تحتاج إلى النظر إلى أقصى درجات المتغير التابع ، على سبيل المثال ، يكون الأطفال في خطر عندما تكون أوزانهم منخفضة ، لذلك قد ترغب في النظر إلى أقصى الحدود في هذا المثال.
مثلما أن المتوسط ليس وصفًا كاملاً لمتغير واحد ، فإن الانحدار الخطي ليس وصفًا كاملاً للعلاقات بين المتغيرات. يمكنك التعامل مع هذه المشكلة باستخدام الانحدار الكمي.
الانحدار الخطي حساس للقيم المتطرفة
القيم المتطرفة هي البيانات التي تثير الدهشة. يمكن أن تكون القيم المتطرفة أحادية المتغير (بناءً على متغير واحد) أو متعددة المتغيرات. إذا كنت تنظر إلى العمر والدخل ، فإن القيم المتطرفة أحادية المتغير ستكون أشياء مثل شخص يبلغ من العمر 118 عامًا ، أو شخصًا حقق 12 مليون دولار العام الماضي. سيكون المتطرف متعدد المتغيرات هو 18 عامًا حصل على 200000 دولار. في هذه الحالة ، لا العمر ولا الدخل مفرطين للغاية ، لكن قلة قليلة من الأشخاص البالغين 18 عامًا يكسبون هذا القدر من المال.
يمكن أن يكون للقيم المتطرفة تأثيرات ضخمة على الانحدار. يمكنك التعامل مع هذه المشكلة عن طريق طلب إحصائيات التأثير من برنامجك الإحصائي.
يجب أن تكون البيانات مستقلة
يفترض الانحدار الخطي أن البيانات مستقلة. هذا يعني أن الدرجات الخاصة بموضوع ما (مثل شخص) لا علاقة لها بتلك الخاصة بموضوع آخر. هذا غالبًا ، ولكن ليس دائمًا ، معقول. هناك حالتان شائعتان حيث لا معنى لهما ، وهما التجمع في المكان والزمان.
من الأمثلة الكلاسيكية للتجميع في الفضاء درجات اختبار الطلاب ، عندما يكون لديك طلاب من فصول ودرجات ومدارس ومناطق تعليمية مختلفة. يميل الطلاب في نفس الفصل إلى أن يكونوا متشابهين من نواحٍ عديدة ، أي أنهم غالبًا ما يأتون من نفس الأحياء ، ولديهم نفس المعلمين ، إلخ. وبالتالي ، فهم ليسوا مستقلين.
أمثلة على التجميع الزمني هي أي دراسات تقيس فيها نفس الموضوعات عدة مرات. على سبيل المثال ، في دراسة النظام الغذائي والوزن ، يمكنك قياس كل شخص عدة مرات. هذه البيانات ليست مستقلة لأن ما يزنه الشخص في مناسبة ما يرتبط بما يزنه في مناسبات أخرى. طريقة واحدة للتعامل مع هذا مع النماذج متعددة المستويات.