ניסויים בודקים תחזיות. תחזיות אלה הן לרוב מספריות, כלומר, ככל שמדענים אוספים נתונים, הם מצפים שהמספרים יתפרקו בצורה מסוימת. נתוני העולם האמיתי לעיתים רחוקות תואמים בדיוק את התחזיות שהמדענים מציגים, ולכן מדענים זקוקים לבדיקה בכדי לומר להם אם ההבדל בין שנצפה והמספרים הצפויים הם בגלל סיכוי אקראי, או בגלל גורם לא צפוי כלשהו שיאלץ את המדען להתאים את התיאוריה הבסיסית. בדיקת ריבוע צ'י היא כלי סטטיסטי בו משתמשים מדענים למטרה זו.
סוג הנתונים הנדרש
אתה צריך נתונים קטגוריים כדי להשתמש במבחן ריבועי. דוגמה לנתונים קטגוריים היא מספר האנשים שענו על שאלה "כן" לעומת מספר האנשים שענו השאלה "לא" (שתי קטגוריות), או מספר הצפרדעים באוכלוסייה שהם ירוקים, צהובים או אפורים (שלוש קטגוריות). אינך יכול להשתמש במבחן ריבועי צ'י על נתונים רציפים, כמו שאפשר לאסוף מסקר ששואל אנשים כמה הם גבוהים. מסקר כזה היית מקבל מגוון רחב של גבהים. עם זאת, אם חילקת את הגבהים לקטגוריות כגון "מתחת לגובה 6 מטר" ו"גובה 6 מטר ומעלה ", תוכל להשתמש במבחן ריבועי צ'י על הנתונים.
מבחן טובת הכושר
מבחן כשירות טובה הוא מבחן נפוץ, ואולי הפשוט ביותר, המבוצע באמצעות הנתון הריבועי הצ'י. במבחן כשירות, המדען מנבא ספציפית לגבי המספרים שהיא מצפה לראות בכל קטגוריה של הנתונים שלה. לאחר מכן היא אוספת נתונים בעולם האמיתי - הנקראים נתונים נצפו - ומשתמשת במבחן הריבוע הצ'י כדי לראות אם הנתונים שנצפו תואמים את ציפיותיה.
לדוגמא, דמיין שביולוג חוקר את דפוסי הירושה במין צפרדע. בקרב 100 צאצאים של קבוצת הורים לצפרדעים, המודל הגנטי של הביולוג מוביל אותה לצפות ל -25 צאצאים צהובים, ל -50 צאצאים ירוקים ול -25 צאצאים אפורים. מה שהיא בעצם צופה הוא 20 צאצאים צהובים, 52 צאצאים ירוקים ו -28 צאצאים אפורים. האם התחזית שלה נתמכת או שהמודל הגנטי שלה אינו נכון? היא יכולה להשתמש במבחן צ'י מרובע כדי לגלות.
חישוב הסטטיסטיקה של כיכר הצ'י
התחל לחשב את נתון הריבוע הצ'י על ידי הפחתת כל ערך צפוי מהערך הנצפה המתאים שלו וריבוע כל תוצאה. החישוב לדוגמא של צאצאי הצפרדע ייראה כך:
צהוב = (20 - 25) ^ 2 = 25 ירוק = (52 - 50) ^ 2 = 4 אפור = (28 - 25) ^ 2 = 9
כעת חלק את כל התוצאות לפי הערך הצפוי המתאים לה.
צהוב = 25 ÷ 25 = 1 ירוק = 4 ÷ 50 = 0.08 אפור = 9 ÷ 25 = 0.36
לסיום, הוסיפו את התשובות מהשלב הקודם.
ריבוע צ'י = 1 + 0.08 + 0.36 = 1.44
פירוש הסטטיסטיקה של כיכר הצ'י
הסטטיסטיקה של הריבוע הצ'י מספרת לך עד כמה הערכים הנצפים שלך היו שונים מהערכים החזויים שלך. ככל שהמספר גבוה יותר, כך ההבדל גדול יותר. אתה יכול לקבוע אם ערך הריבוע הצ'י שלך גבוה מדי או נמוך מספיק כדי לתמוך בחיזוי שלך על ידי לראות אם הוא נמוך מסוים ערך קריטי על שולחן חלוקה של ריבועי צ'י. טבלה זו תואמת ערכי ריבועי צ'י עם הסתברויות, הנקראות ערכי p. באופן ספציפי, הטבלה מציגה לך את ההסתברות שההבדלים בין הערכים הנצפים שלך לבין הצפוי שלך הם פשוט בגלל סיכוי אקראי או אם קיים גורם אחר. לבדיקת התאמה טובה, אם ערך ה- p הוא 0.05 ומטה, עליך לדחות את התחזית שלך.
אתה חייב לקבוע את דרגות חופש (df) בנתונים שלך לפני שתוכל לחפש את הערך הצ'י-מרובע הקריטי בטבלת ההפצה. דרגות חופש מחושבות על ידי הפחתת 1 ממספר הקטגוריות בנתונים שלך. ישנן שלוש קטגוריות בדוגמה זו, כך שישנן 2 דרגות חופש. מבט אל טבלת חלוקה צ'י מרובעת זו אומר לך שעבור 2 דרגות חופש, הערך הקריטי להסתברות של 0.05 הוא 5.99. המשמעות היא שכל עוד הערך הצ'י-מרובע המחושב שלך הוא פחות מ- 5.99, הערכים הצפויים שלך, ולכן התיאוריה הבסיסית, תקפים ונתמכים. מאחר שהנתון הצ'י-ריבועי לנתוני צאצאי הצפרדעים היה 1.44, הביולוג יכול לקבל את המודל הגנטי שלה.