일련의 숫자의 "중앙값"은 모든 데이터가 순차적으로 정렬 된 경우 중간 숫자를 나타냅니다. 중앙값 계산은 일반 평균 계산보다 특이 치의 영향을 덜받습니다. 이상 값은 다른 모든 숫자와 크게 차이가 나는 극단적 인 측정 값입니다. 더 많은 특이 치가 표준 평균을 왜곡하고, 이상치 발생에 저항하기 때문에 중앙값을 사용할 수 있습니다. 편견. 더 많은 데이터가 추가되면 중앙값이 변경 될 수 있지만 일반적으로 평균만큼 크게 변경되지는 않습니다.
일련의 숫자를 가장 작은 것에서 가장 큰 순서로 정렬하십시오. 예를 들어, 숫자가 5, 8, 1, 3, 155, 7, 7, 6, 7, 8이라고 가정합니다. 1, 3, 5, 6, 6, 7, 7, 7, 8, 155로 정렬합니다.
중간 번호를 찾으십시오. 데이터 포인트가 짝수 인 경우처럼 두 개의 중간 숫자가있는 경우 두 중간 숫자의 평균을 취합니다. 이 예에서 중간 숫자는 6과 7입니다. 두 숫자의 평균은 합계를 2로 나눈 값이므로 중앙값 6.5를 얻습니다.
전체 데이터 세트의 평균은 20.5이므로 중앙값을 사용하여 얻을 수있는 차이를 확인할 수 있습니다. 155 수치는 특이 치이며 나머지 수치와 전혀 일치하지 않습니다. 따라서이 경우 중앙값은 평균보다 더 나은 측정 값을 제공합니다.
번호를 획득하면서 순서대로 계속 추가하십시오. 예제를 계속하려면 5 개의 새 데이터 포인트를 1, 8, 7, 9, 205로 측정했다고 가정합니다. 목록에 추가하면 1, 1, 3, 5, 6, 6, 7, 7, 7, 7, 8, 8, 9, 155, 205가 표시됩니다.
이전과 마찬가지로 새로운 중앙값을 찾으십시오. 이 예에는 15 개의 데이터 포인트가 있으므로 중간에있는 "7"을 찾습니다.
평균을 사용하는 경우 29를 계산할 것입니다. 이는 다시 모든 데이터 요소에서 상당한 차이를 보입니다.
중앙값의 변화를 계산하려면 이전 중앙값에서 새 중앙값 계산을 뺍니다. 이 예에서 계산은 7.0에서 6.5를 뺀 값으로 중앙값이 0.5만큼 변경되었음을 나타냅니다.
평균을 계산한다면 변화는 8.5가 될 것입니다. 이것은 상당히 큰 도약이며 아마도 정당하지 않을 것입니다.