ข้อเสียของการถดถอยเชิงเส้น

การถดถอยเชิงเส้นเป็นวิธีทางสถิติในการตรวจสอบความสัมพันธ์ระหว่างตัวแปรตาม ซึ่งแสดงเป็น คุณ และตัวแปรอิสระตั้งแต่หนึ่งตัวขึ้นไป แสดงว่า x. ตัวแปรตามต้องต่อเนื่อง โดยสามารถรับค่าใด ๆ หรืออย่างน้อยก็ใกล้เคียงกับค่าต่อเนื่อง ตัวแปรอิสระสามารถเป็นประเภทใดก็ได้ แม้ว่าการถดถอยเชิงเส้นจะไม่สามารถแสดงสาเหตุได้เอง แต่ตัวแปรตามมักจะได้รับผลกระทบจากตัวแปรอิสระ

การถดถอยเชิงเส้นจำกัดเฉพาะความสัมพันธ์เชิงเส้น

โดยธรรมชาติแล้ว การถดถอยเชิงเส้นจะพิจารณาเฉพาะความสัมพันธ์เชิงเส้นระหว่างตัวแปรตามและตัวแปรอิสระเท่านั้น นั่นคือถือว่ามีความสัมพันธ์แบบเส้นตรงระหว่างพวกเขา บางครั้งสิ่งนี้ไม่ถูกต้อง ตัวอย่างเช่น ความสัมพันธ์ระหว่างรายได้และอายุมีความโค้ง กล่าวคือ รายได้มีแนวโน้มที่จะเพิ่มขึ้นในช่วงเริ่มต้นของวัยผู้ใหญ่ ลดลงในวัยผู้ใหญ่ตอนปลาย และลดลงหลังจากผู้คนเกษียณอายุ คุณสามารถบอกได้ว่านี่เป็นปัญหาหรือไม่โดยดูจากการแสดงความสัมพันธ์แบบกราฟิก

การถดถอยเชิงเส้นจะดูเฉพาะค่าเฉลี่ยของตัวแปรตาม

การถดถอยเชิงเส้นพิจารณาความสัมพันธ์ระหว่างค่าเฉลี่ยของตัวแปรตามและตัวแปรอิสระ ตัวอย่างเช่น หากคุณดูความสัมพันธ์ระหว่างน้ำหนักแรกเกิดของทารกและมารดา ลักษณะต่างๆ เช่น อายุ การถดถอยเชิงเส้น จะพิจารณาน้ำหนักเฉลี่ยของทารกที่เกิดจากมารดาของ อายุที่แตกต่างกัน อย่างไรก็ตาม ในบางครั้ง คุณจำเป็นต้องดูค่าสูงสุดของตัวแปรตาม เช่น ทารกมีความเสี่ยงเมื่อน้ำหนักของพวกเขาอยู่ในระดับต่ำ ดังนั้น คุณจึงควรดูค่าสูงสุดในตัวอย่างนี้

เช่นเดียวกับค่าเฉลี่ยไม่ใช่คำอธิบายที่สมบูรณ์ของตัวแปรเดียว การถดถอยเชิงเส้นก็ไม่ใช่คำอธิบายที่สมบูรณ์ของความสัมพันธ์ระหว่างตัวแปร คุณสามารถจัดการกับปัญหานี้ได้โดยใช้การถดถอยควอนไทล์

การถดถอยเชิงเส้นมีความสำคัญต่อค่าผิดปกติ

ค่าผิดปกติคือข้อมูลที่น่าแปลกใจ ค่าผิดปกติอาจเป็นตัวแปรเดียว (ขึ้นอยู่กับตัวแปรเดียว) หรือหลายตัวแปร หากคุณกำลังพิจารณาอายุและรายได้ ค่าผิดปกติที่ไม่แปรผันจะเหมือนกับบุคคลที่อายุ 118 ปี หรือคนที่ทำเงินได้ 12 ล้านดอลลาร์ในปีที่แล้ว ค่าผิดปกติหลายตัวแปรจะเป็นเด็กอายุ 18 ปีที่ทำเงินได้ 200,000 เหรียญ ในกรณีนี้ อายุและรายได้ไม่สูงมาก แต่มีเพียงไม่กี่คนเท่านั้นที่อายุ 18 ปีทำเงินได้มากขนาดนั้น

ค่าผิดปกติสามารถมีผลกระทบอย่างมากต่อการถดถอย คุณสามารถจัดการกับปัญหานี้ได้โดยขอสถิติอิทธิพลจากซอฟต์แวร์ทางสถิติของคุณ

ข้อมูลต้องเป็นอิสระ

การถดถอยเชิงเส้นถือว่าข้อมูลเป็นอิสระ นั่นหมายความว่าคะแนนของวิชาหนึ่ง (เช่น บุคคล) ไม่เกี่ยวอะไรกับอีกวิชาหนึ่ง สิ่งนี้มักจะสมเหตุสมผล แต่ก็ไม่เสมอไป กรณีทั่วไปสองกรณีที่ไม่สมเหตุสมผลคือการจัดกลุ่มในอวกาศและเวลา

ตัวอย่างคลาสสิกของการจัดกลุ่มในอวกาศคือคะแนนการทดสอบของนักเรียน เมื่อคุณมีนักเรียนจากชั้นเรียน เกรด โรงเรียนและเขตการศึกษาต่างๆ นักเรียนในชั้นเรียนเดียวกันมักจะมีความคล้ายคลึงกันหลายประการ กล่าวคือ มักมาจากย่านเดียวกัน มีครูคนเดียวกัน เป็นต้น จึงไม่เป็นอิสระ

ตัวอย่างของการจัดกลุ่มในเวลาคือการศึกษาใดๆ ที่คุณวัดหัวข้อเดียวกันหลายครั้ง ตัวอย่างเช่น ในการศึกษาเรื่องอาหารและน้ำหนัก คุณอาจวัดแต่ละคนหลายครั้ง ข้อมูลเหล่านี้ไม่เป็นอิสระเนื่องจากสิ่งที่บุคคลชั่งน้ำหนักในโอกาสหนึ่งเกี่ยวข้องกับสิ่งที่เขาหรือเธอชั่งน้ำหนักในโอกาสอื่นๆ วิธีหนึ่งในการจัดการกับสิ่งนี้คือกับโมเดลหลายระดับ

  • แบ่งปัน
instagram viewer