ヒストグラムのビン幅を決定する方法

統計を使用している場合は、ヒストグラムを使用して、数値のコレクションの視覚的な要約を提供できます。 ヒストグラムは、一連の縦の列を並べて使用してデータの分布を示す棒グラフに少し似ています。 ヒストグラムを作成するには、最初にデータを「ビン」に並べ替えてから、各ビンのデータポイントの数を数えます。 ヒストグラムの各列の高さは、そのビンに含まれるデータポイントの数に比例します。 正しい数のビンを選択すると、最適なヒストグラムが得られます。

ヒストグラムを構成するデータポイントの数の立方根の値を計算します。 たとえば、200人の身長のヒストグラムを作成する場合、200の立方根(5.848)を取得します。 ほとんどの関数電卓には、この計算を実行するために使用できる立方根関数があります。

計算した値の逆数を取ります。 これを行うには、値を1に分割するか、関数電卓の「1 / x」キーを使用します。 5.848の逆数は1 / 5.84 = 0.171です。

新しい値にデータセットの標準偏差を掛けます。 標準偏差は、一連の数値の変動量の尺度です。 統計関数を備えた計算機を使用して、データのこの数値を計算するか、手動で計算できます。 後者を行うには、データポイントの平均を決定します。 各データポイントが平均からどれだけ離れているかを把握します。 これらの違いをそれぞれ2乗し、平均します。 次に、この数の平方根を取ります。 たとえば、身長データの標準偏差が2.8インチの場合、2.8 x 0.171 = 0.479と計算されます。

導出した数値に3.49を掛けます。 値3.49は統計理論から導出された定数であり、この計算の結果は、データのヒストグラムを作成するために使用する必要があるビンの幅です。 高さの例の場合、3.49 x 0.479 = 1.7インチを計算します。 これは、最低の高さが5フィートの場合、最初のビンは5フィートから5フィート1.7インチに及ぶことを意味します。 このビンの列の高さは、200個の測定された高さのうちのいくつがこの範囲内にあったかによって異なります。 次のビンは、5フィート1.7インチから5フィート3.4インチなどになります。

  • シェア
instagram viewer