히스토그램은 데이터를 그래픽으로 표현한 것입니다. 동일한 정보를 표 형식으로 표시 할 수 있지만 히스토그램을 사용하면 다른 데이터, 발생 빈도 및 범주를 쉽게 식별 할 수 있습니다. 하나는 수평이고 다른 하나는 수직입니다. 히스토그램의 또 다른 이름은 막대 차트입니다.
일반 시놉시스
히스토그램의 일반적인 목적은 특정 데이터에 대해 쉽게 이해할 수있는 요약을 제공하는 것입니다. 거의 모든 유형의 데이터가 될 수 있습니다. 기록 된 데이터는 수직 블록이있는 차트로 전치됩니다. 블록 수는 수집 된 데이터 범주에 따라 다릅니다. 예를 들어, 일주일에 발생하는 일의 빈도를 측정하는 경우 수평선을 따라 7 개의 섹션이 있습니다. 수직선에는 이벤트가 발생한 횟수를 나타내는 숫자가 있습니다.
통계적 목적
히스토그램에 표시된 데이터를 사용하여 통계 정보를 확인할 수 있습니다. 여기에는 평균값 (모든 블록의 평균)이 포함됩니다. 최대 값 – 가장 높은 블록; 그리고 최소값 – 가장 낮은 블록. 블록 수는 1 년의 월과 같이 측정하는 항목의 수를 결정합니다. 각 블록의 상단은 수직선의 숫자와 일치하며 빈도를 결정할 수 있습니다.
트렌드
히스토그램은 추세를 추적합니다. 예를 들어 수평선을 1 월부터 12 월과 세로선이 기온으로 나뉘어 기온의 추이를 볼 수 있습니다. 그 해. 또 다른 예는 연도를 나타내는 수평선과 가계 소득을 나타내는 수직선 섹션이 있습니다. 소득 데이터가 히스토그램에 입력되면 추세를 볼 수 있습니다.
데이터 배포
데이터 분포에 따라 몇 가지 일반적인 유형의 히스토그램이 있습니다. "정상"이라는 용어는 히스토그램의 모양이 중앙 블록에 도달 할 때까지 올라 갔다가 다시 떨어질 때 적용됩니다. 첫 번째 블록이 가장 높고 각 후속 블록의 높이가 이전 블록보다 짧은 경우 "클리프 유사"를 히스토그램에 적용 할 수 있습니다. "Skewed"는 블록이 상승했다가 블록 중앙에 도달하기 전에 떨어질 때 적용되는 반면, "고원"은 높이가 비슷한 일반적으로 높은 블록이있는 히스토그램입니다.
약점
히스토그램에는 많은 이점이 있지만 두 가지 약점이 있습니다. 히스토그램은 잘못된 데이터를 나타낼 수 있습니다. 예를 들어 블록을 너무 많이 사용하면 분석이 어려울 수 있지만 너무 적 으면 중요한 데이터를 빠뜨릴 수 있습니다. 히스토그램은 두 세트의 데이터를 기반으로하지만 특정 유형의 통계 데이터를 분석하려면 두 세트 이상의 데이터가 필요합니다. 예를 들어, 블록은 1 년의 개월 수와 수직선, 매달 대학에 다니는 학생 수를 나타낼 수 있습니다. 하지만 남학생과 여학생의 수는 알려주지 않습니다.