실험은 예측을 테스트합니다. 이러한 예측은 종종 수치 적이므로 과학자가 데이터를 수집 할 때 숫자가 특정 방식으로 분해 될 것으로 예상합니다. 실제 데이터는 과학자가 내린 예측과 거의 일치하지 않으므로 과학자는 관측치의 차이가 있는지 여부를 알려주는 테스트가 필요합니다. 예상되는 숫자는 무작위 기회 때문이거나 과학자로 하여금 근본적인 이론을 조정하도록하는 예상치 못한 요인 때문입니다. 카이-제곱 검정은 과학자들이 이러한 목적으로 사용하는 통계 도구입니다.
필요한 데이터 유형
카이-제곱 검정을 사용하려면 범주 형 데이터가 필요합니다. 범주 형 데이터의 예로는 "예"라고 대답 한 사람 수와 대답 한 사람 수를들 수 있습니다. 질문 "아니오"(2 개 범주) 또는 개체군에서 녹색, 노란색 또는 회색 (3 개 범주) 인 개구리 수. 사람들에게 키가 얼마나되는지 묻는 설문 조사에서 수집 된 것과 같은 연속 데이터에 대해 카이 제곱 검정을 사용할 수 없습니다. 이러한 설문 조사에서 광범위한 높이를 얻을 수 있습니다. 그러나 높이를 "6 피트 미만"및 "6 피트 이상"과 같은 범주로 나눈 경우 데이터에 대해 카이-제곱 검정을 사용할 수 있습니다.
적합도 테스트
적합도 검정은 카이-제곱 통계를 사용하여 수행되는 일반적인 검정이며 아마도 가장 간단한 검정입니다. 적합도 테스트에서 과학자는 데이터의 각 범주에서 볼 것으로 예상되는 숫자에 대해 구체적인 예측을합니다. 그런 다음 관찰 데이터라고하는 실제 데이터를 수집하고 카이 제곱 검정을 사용하여 관찰 된 데이터가 예상과 일치하는지 확인합니다.
예를 들어, 한 생물학자가 개구리 종의 유전 패턴을 연구한다고 상상해보십시오. 한 쌍의 개구리 부모 중 100 마리의 자손 중에서 생물학 자의 유전 모델은 그녀가 25 마리의 노란색 자손, 50 마리의 녹색 자손, 25 마리의 회색 자손을 기대하도록 유도합니다. 그녀가 실제로 관찰 한 것은 20 마리의 노란색 자손, 52 마리의 녹색 자손, 28 마리의 회색 자손입니다. 그녀의 예측이 뒷받침됩니까 아니면 유전 모델이 올바르지 않습니까? 카이 제곱 검정을 사용하여 알아낼 수 있습니다.
카이-제곱 통계량 계산
해당 관측 값에서 각 기대 값을 빼고 각 결과를 제곱하여 카이-제곱 통계량 계산을 시작합니다. 개구리 자손의 예에 대한 계산은 다음과 같습니다.
노란색 = (20-25) ^ 2 = 25 녹색 = (52-50) ^ 2 = 4 회색 = (28-25) ^ 2 = 9
이제 각 결과를 해당 예상 값으로 나눕니다.
노란색 = 25 ÷ 25 = 1 녹색 = 4 ÷ 50 = 0.08 회색 = 9 ÷ 25 = 0.36
마지막으로 이전 단계의 답변을 더합니다.
카이-제곱 = 1 + 0.08 + 0.36 = 1.44
카이-제곱 통계 해석
카이-제곱 통계는 관측 값이 예측값과 얼마나 다른지 알려줍니다. 숫자가 클수록 차이가 커집니다. 카이-제곱 값이 특정 값보다 낮은 지 여부를 확인하여 예측을 지원하기에 충분히 높거나 낮은 지 여부를 확인할 수 있습니다. 결정적인 가치 카이-제곱 분포 테이블에서. 이 테이블은 카이-제곱 값과 확률을 일치시킵니다. p- 값. 특히이 표는 관측 값과 기대 값 간의 차이가 단순히 임의의 기회 때문인지 또는 다른 요인이 있는지 여부에 따른 확률을 알려줍니다. 적합도 검정의 경우 p- 값이 0.05 이하이면 예측을 기각해야합니다.
결정해야합니다 자유도 (df) 분포표에서 임계 카이-제곱 값을 조회하기 전에 데이터에서. 자유도는 데이터의 범주 수에서 1을 빼서 계산됩니다. 이 예에는 세 가지 범주가 있으므로 2 개의 자유도가 있습니다. 한눈에 이 카이 제곱 분포표 2 자유도에 대해 0.05 확률의 임계 값이 5.99임을 알려줍니다. 즉, 계산 된 카이-제곱 값이 5.99 미만인 한 예상 값과 기본 이론이 유효하고 지원됩니다. 개구리 자손 데이터에 대한 카이-제곱 통계가 1.44이기 때문에 생물학자는 유전 모델을 받아 들일 수 있습니다.