상자 및 수염 플롯이라고도하는 상자 플롯은 많은 양의 데이터를 5 개 숫자로 요약하여 표시하는 그래프 유형입니다. 이러한 숫자에는 중앙값, 상위 사 분위수, 하위 사 분위수, 최소 및 최대 데이터 값이 포함됩니다. 많은 통계 그래프와 마찬가지로 박스 플롯 방법에는 장단점이 있습니다.
TL; DR (너무 긴; 읽지 않음)
상자 및 수염 플롯은 큰 데이터를 쉽게 처리하지만 분포 결과의 정확한 값과 세부 정보를 유지하지 않습니다. 이러한 그래프를 통해 많은 양의 데이터를 명확하게 요약 할 수 있습니다.
대용량 데이터를 쉽게 처리
5 자리 데이터 요약으로 인해 박스 플롯은 많은 양의 데이터 요약을 처리하고 표시 할 수 있습니다. 상자 그림은 데이터 범위의 중간 점 인 중앙값으로 구성됩니다. 상위 및 하위 사 분위수는 데이터의 최고 및 하위 분기 위와 아래의 숫자와 최소 및 최대 데이터 값을 나타냅니다. 5 가지 주요 개념을 사용하여 상자 그림에서 데이터를 구성하는 것은 선 그림이나 줄기 및 잎 그림과 같은 다른 그래프로는 관리 할 수없는 대용량 데이터를 처리하는 효율적인 방법입니다.
유지되지 않는 정확한 값
상자 그림은 분포 결과의 정확한 값과 세부 정보를 유지하지 않으므로이 그래프 유형에서 이러한 많은 양의 데이터를 처리 할 때 문제가됩니다. 상자 그림은 결과 분포에 대한 간단한 요약 만 표시하므로 빠르게보고 다른 데이터와 비교할 수 있습니다. 데이터에 대한보다 철저하고 자세한 분석을 위해 히스토그램과 같은 다른 통계 그래프 방법과 함께 상자 그림을 사용합니다.
명확한 요약
박스 플롯은 하나 이상의 데이터 세트에 대한 명확한 요약을 시각적으로 효과적으로 볼 수있는 방법입니다. 다른 실험의 여러 결과 세트를 빠르게 요약하고 비교하는 데 특히 유용합니다. 한 눈에 박스 플롯을 통해 결과 분포를 그래픽으로 표시하고 데이터 내에서 대칭성을 표시 할 수 있습니다.
이상 값 표시
상자 그림은 특이 치를 보여주는 통계적 그래프 방법 중 하나입니다. 데이터 세트 내에 하나의 이상 값 또는 여러 개의 이상 값이있을 수 있으며, 이는 최소 및 최대 데이터 값 아래 및 위에 모두 발생합니다. 더 작은 데이터 값과 더 큰 데이터 값을 사 분위수 범위의 최대 1.5 배로 확장하면 상자 그림이 이상 값 또는 모호한 결과를 제공합니다. 이상 값으로 알려진 최소값과 최대 값을 벗어나는 데이터의 결과는 상자 그림 그래프에서 쉽게 확인할 수 있습니다.