כיצד לחשב SSE

כשמתאימים קו ישר למערכת נתונים, אתה עשוי להיות מעוניין לקבוע עד כמה הקו המתקבל מתאים לנתונים. אחת הדרכים לעשות זאת היא לחשב את סכום הריבועים שגיאה (SSE). ערך זה מספק מדד עד כמה קו המתאים בצורה הטובה ביותר לערכת הנתונים. ה- SSE הוא חשוב לניתוח נתונים ניסיוניים והוא נקבע באמצעות כמה צעדים קצרים בלבד.

מצא שורה המתאימה ביותר למודל הנתונים באמצעות רגרסיה. לקו המתאים ביותר יש את הצורה y = ax + b, כאשר a ו- b הם פרמטרים שעליך לקבוע. ניתן למצוא פרמטרים אלה באמצעות ניתוח רגרסיה לינארית פשוטה. לדוגמא, נניח שלקו המתאים ביותר יש את הצורה y = 0.8x + 7.

השתמש במשוואה כדי לקבוע את הערך של כל ערך y שנחזה על ידי קו ההתאמה הטובה ביותר. אתה יכול לעשות זאת על ידי החלפת כל ערך x למשוואת השורה. לדוגמא, אם x שווה ל -1, החלפה זו למשוואה y = 0.8x + 7 נותנת 7.8 לערך y.

קבע את ממוצע הערכים החזויים מקו משוואת ההתאמה הטובה ביותר. אתה יכול לעשות זאת על ידי סיכום כל ערכי ה- y החזויים מהמשוואות, וחלוקת המספר המתקבל במספר הערכים. לדוגמא, אם הערכים הם 7.8, 8.6 ו- 9.4, סיכום ערכים אלה נותן 25.8, וחלוקת מספר זה במספר הערכים, 3 במקרה זה, נותנת 8.6.

מחסרים כל אחד מהערכים הבודדים מהממוצע, ומרובעים את המספר המתקבל. בדוגמה שלנו, אם נפחית את הערך 7.8 מהממוצע 8.6, המספר המתקבל הוא 0.8. ריבוע ערך זה נותן 0.64.

סכם את כל הערכים בריבוע משלב 4. אם תיישם את ההוראות בשלב 4 על כל שלושת הערכים בדוגמה שלנו, תמצא ערכים של 0.64, 0 ו- 0.64. סיכום ערכים אלה נותן 1.28. זהו סכום שגיאת הריבועים.

  • לַחֲלוֹק
instagram viewer