종종 IQR로 축약되는 사 분위수 범위는 주어진 데이터 세트의 25 번째 백분위 수에서 75 번째 백분위 수 또는 중간 50 %까지의 범위를 나타냅니다. 사 분위 간 범위는 테스트의 평균 성능 범위를 결정하는 데 사용할 수 있습니다. 특정 시험에서 대부분의 사람들의 점수가 떨어지는 곳, 또는 회사의 평균 직원이 각각 얼마나 많은 돈을 버는 지 결정 달. 사 분위수 범위는 단일 숫자가 아닌 분산 범위를 식별 할 수 있기 때문에 데이터 세트의 평균 또는 중앙값보다 더 효과적인 데이터 분석 도구가 될 수 있습니다.
TL; DR (너무 깁니다. 읽지 않음)
사 분위 간 범위 (IQR)는 데이터 세트의 중간 50 %를 나타냅니다. 이를 계산하려면 먼저 데이터 포인트를 최소에서 최대로 정렬 한 다음 1 사 분위수와 3 사 분위수를 결정합니다. 공식 (N + 1) / 4 및 3 * (N + 1) / 4를 각각 사용하여 위치를 지정합니다. 여기서 N은 데이터의 포인트 수입니다. 세트. 마지막으로, 데이터 세트의 사 분위수 범위를 결정하기 위해 세 번째 사 분위수에서 첫 번째 사 분위수를 빼십시오.
주문 데이터 포인트
사 분위수 범위 계산은 간단한 작업이지만 계산하기 전에 데이터 세트의 다양한 지점을 정렬해야합니다. 이렇게하려면 데이터 포인트를 최소에서 최대로 순서를 지정하십시오. 예를 들어 데이터 포인트가 10, 19, 8, 4, 9, 12, 15, 11 및 20이라면 다음과 같이 재 배열합니다. {4, 8, 9, 10, 11, 12, 15, 19, 20}. 데이터 포인트가 이와 같이 주문되면 다음 단계로 이동할 수 있습니다.
1 분위 위치 결정
다음으로 다음 공식을 사용하여 1 사 분위수의 위치를 결정합니다. (N + 1) / 4, 여기서 N은 데이터 세트의 점 수입니다. 첫 번째 사 분위수가 두 숫자 사이에 있으면 두 숫자의 평균을 첫 번째 사 분위수 점수로 취하십시오. 위의 예에서는 9 개의 데이터 포인트가 있으므로 1에서 9를 더하여 10을 얻은 다음 4로 나누어 2.5를 얻습니다. 이후 첫 번째 사 분위수가 두 번째와 세 번째 값 사이에 있으면 평균 8과 9를 사용하여 첫 번째 사 분위수 위치를 얻습니다. 8.5.
3 분위 위치 결정
제 1 사 분위수를 결정했으면 다음 공식을 사용하여 제 3 사 분위수의 위치를 결정합니다. 3 * (N + 1) / 4 여기서 N은 다시 데이터 세트의 포인트 수입니다. 마찬가지로, 제 3 사 분위수가 두 숫자 사이에 있으면 제 1 사 분위수 점수를 계산할 때처럼 평균을 취하십시오. 위의 예에서는 9 개의 데이터 포인트가 있으므로 1에서 9를 더하여 10을 얻고 3을 곱하여 30을 얻은 다음 4로 나누면 7.5가됩니다. 1 사 분위수가 7 ~ 8 번째 값 사이에 있으므로 평균 15 ~ 19를 취하여 3 사 분위수 17을 얻습니다.
사 분위 간 범위 계산
1 사 분위수와 3 사 분위수를 결정했으면 3 사 분위수 값에서 1 사 분위수 값을 빼서 사 분위수 범위를 계산합니다. 이 기사의 과정에서 사용 된 예제를 마치려면 17에서 8.5를 빼서 데이터 세트의 사 분위수 범위가 8.5임을 확인합니다.
IQR의 장점과 단점
사 분위수 범위는 데이터 세트의 양쪽 끝에서 특이 치를 식별하고 제거 할 수 있다는 장점이 있습니다. IQR은 또한 치우친 데이터 분포의 경우 변동에 대한 좋은 척도이며 IQR을 계산하는이 방법은 누적 빈도 분포를 사용하여 데이터를 구성하는 한 그룹화 된 데이터 세트에 대해 작업 할 수 있습니다. 포인트들. 그룹화 된 데이터에 대한 사 분위수 범위 공식은 그룹화되지 않은 데이터와 동일하며 IQR은 세 번째 사 분위수 값에서 1 사 분위수 값을 뺀 값과 같습니다. 그러나 표준 편차와 비교할 때 몇 가지 단점이 있습니다. 몇 가지 극단적 인 점수에 대한 민감도가 낮고 표준 편차만큼 강하지 않은 샘플링 안정성이 있습니다.