히스토그램의 빈 너비를 결정하는 방법

통계로 작업하는 경우 히스토그램을 사용하여 숫자 모음에 대한 시각적 요약을 제공 할 수 있습니다. 히스토그램은 데이터의 분포를 표시하기 위해 일련의 나란히 세로 열을 사용하는 막대 그래프와 약간 비슷합니다. 히스토그램을 만들려면 먼저 데이터를 "빈"으로 정렬 한 다음 각 빈의 데이터 포인트 수를 계산합니다. 히스토그램에서 각 열의 높이는 해당 저장소에 포함 된 데이터 포인트의 수에 비례합니다. 올바른 수의 빈을 선택하면 최적의 히스토그램을 얻을 수 있습니다.

히스토그램을 구성 할 데이터 포인트 수의 세제곱근 값을 계산합니다. 예를 들어, 200 명의 키에 대한 히스토그램을 만드는 경우 200의 세제곱근 (5.848)을 사용합니다. 대부분의 공학용 계산기에는이 계산을 수행하는 데 사용할 수있는 세제곱근 함수가 있습니다.

방금 계산 한 값의 역을 취하십시오. 이를 위해 값을 1로 나누거나 공학용 계산기에서 "1 / x"키를 사용할 수 있습니다. 5.848의 역은 1 / 5.848 = 0.171입니다.

새 값에 데이터 세트의 표준 편차를 곱하십시오. 표준 편차는 일련의 숫자의 변동량을 측정 한 것입니다. 통계 함수가있는 계산기를 사용하여 데이터에 대해이 숫자를 계산하거나 수동으로 계산할 수 있습니다. 후자를 수행하려면 데이터 포인트의 평균을 결정하십시오. 각 데이터 포인트가 평균에서 얼마나 떨어져 있는지 알아 내십시오. 이러한 차이를 제곱 한 다음 평균을 내십시오. 그런 다음이 숫자의 제곱근을 취하십시오. 예를 들어 키 데이터의 표준 편차가 2.8 인치 인 경우 2.8 x 0.171 = 0.479를 계산합니다.

방금 도출 한 숫자에 3.49를 곱하십시오. 3.49 값은 통계 이론에서 파생 된 상수이며이 계산의 결과는 데이터의 히스토그램을 구성하는 데 사용해야하는 빈 너비입니다. 높이 예제의 경우 3.49 x 0.479 = 1.7 인치를 계산합니다. 즉, 가장 낮은 높이가 5 피트 인 경우 첫 번째 저장소는 5 피트에서 5 피트 1.7 인치에 걸쳐 있습니다. 이 빈의 열 높이는 200 개의 측정 된 높이 중이 범위 내에있는 높이에 따라 달라집니다. 다음 빈은 5 피트 1.7 인치에서 5 피트 3.4 인치 등이됩니다.

  • 공유
instagram viewer