אחד הכלים הבסיסיים ביותר לניתוח הנדסי או מדעי הוא רגרסיה לינארית. טכניקה זו מתחילה במערכת נתונים בשני משתנים. המשתנה הבלתי תלוי נקרא בדרך כלל "x" והמשתנה התלוי נקרא בדרך כלל "y". מטרת הטכניקה היא לזהות את הקו, y = mx + b, המקרב את מערך הנתונים. קו מגמה זה יכול להראות, בצורה גרפית ומספרית, קשרים בין המשתנים התלויים והבלתי תלויים. מניתוח רגרסיה זה מחושב גם ערך למתאם.
זהה והפריד בין ערכי x ו- y של נקודות הנתונים שלך. אם אתה משתמש בגיליון אלקטרוני, הזן אותם לעמודות סמוכות. צריך להיות מספר זהה של ערכי x ו- y. אם לא, החישוב לא יהיה מדויק, או שפונקציית הגיליון האלקטרוני תחזיר שגיאה. x = (6, 5, 11, 7, 5, 4, 4) y = (2, 3, 9, 1, 8, 7, 5)
חישב את הערך הממוצע עבור ערכי x וערכי y על ידי חלוקת סכום הערכים במספר הערכים הכולל בערכה. ממוצעים אלו יכונו "x_avg" ו- y_avg. "X_avg = (6 + 5 + 11 + 7 + 5 + 4 + 4) / 7 = 6 y_avg = (2 + 3 + 9 + 1 + 8 + 7 + 5) / 7 = 5
צור שתי קבוצות נתונים חדשות על ידי הפחתת הערך x_avg מכל ערך x ואת הערך y_avg מכל ערך y. x1 = (6 - 6, 5 - 6, 11 - 6, 7 - 6... ) x1 = (0, -1, 5, 1, -1, -2, -2) y1 = (2-5, 3-5, 9-5, 1-5,... ) y1 = (-3, -2, 4, -4, 3, 2, 0)
הכפל כל ערך x1 בכל ערך y1, לפי הסדר. x1y1 = (0 * -3, -1 * -2, 5 * 4,... ) x1y1 = (0, 2, 20, -4, -3, -4, 0)
ריבוע כל ערך x1. x1 ^ 2 = (0 ^ 2, 1 ^ 2, -5 ^ 2,... ) x1 ^ 2 = (0, 1, 25, 1, 1, 4, 4)
חשב את סכומי הערכים x1y1 וערכי x1 ^ 2. sum_x1y1 = 0 + 2 + 20 - 4 - 3 - 4 + 0 = 11 sum_x1 ^ 2 = 0 + 1+ 25 + 1 + 1 + 4 + 4 = 36
חלק את "sum_x1y1" ב- "sum_x1 ^ 2" כדי לקבל את מקדם הרגרסיה. sum_x1y1 / sum_x1 ^ 2 = 11/36 = 0.306
דברים שתזדקק להם
- תוכנת גיליון אלקטרוני (אופציונלי)
- מַחשְׁבוֹן
טיפים
-
למי שמעדיף לעבוד ישירות עם המשוואה, זה m = sum [(x_i - x_avg) (y_i - y_avg)] / sum [(x_i - x_avg) ^ 2].
בגיליונות אלקטרוניים רבים יהיו מגוון פונקציות רגרסיה לינאריות. ב- Microsoft Excel תוכלו להשתמש בפונקציה "שיפוע" כדי לקחת את הממוצע של העמודות x ו- y, והגיליון האלקטרוני יבצע באופן אוטומטי את כל החישובים הנותרים.