度数分布表の長所と短所

度数分布表は、データセット内の特定のタイプのデータの発生数を説明するのに役立ちます。 度数分布とも呼ばれる度数表は、記述統計を表示するための最も基本的なツールの1つです。 度数分布表は、データの分布を一目で確認できる参照として広く利用されています。 それらは解釈が簡単で、かなり簡潔な方法で大きなデータセットを表示できます。 度数分布表は、データセット内の明らかな傾向を特定するのに役立ち、同じタイプのデータセット間でデータを比較するために使用できます。 ただし、度数分布表はすべてのアプリケーションに適しているわけではありません。 それらは極端な値(Xより大きいまたはYより小さい)を不明瞭にする可能性があり、データのスキューおよび尖度の分析には役立ちません。

迅速なデータの視覚化

度数分布表は、大まかな検査だけで、データセット内の外れ値や重要な傾向さえもすばやく明らかにすることができます。 たとえば、教師は、クラスが全体的にどのように行われているかをすばやく確認するために、度数分布表に中間期の生徒の成績を表示する場合があります。 頻度列の数値は、その成績を取得した学生の数を表します。 25人の生徒のクラスの場合、受け取った成績の頻度分布は次のようになります。成績頻度A... 7 B... 13 C... 3 D... 2

相対的な存在量の視覚化

度数分布表は、研究者がサンプル内の特定の各ターゲットデータの相対的な存在量を調べるのに役立ちます。 相対存在量は、データセットのどれだけがターゲットデータで構成されているかを表します。 相対存在量は頻度ヒストグラムとして表されることがよくありますが、頻度テーブルに簡単に表示できます。 中間成績の同じ度数分布を考慮してください。 相対的な存在量は、単に特定の成績を獲得した学生の割合であり、データを考えすぎずに概念化するのに役立ちます。 たとえば、各グレードの発生率を表示する列を追加すると、簡単に次のことができます。 データを詳細に精査することなく、クラスの半数以上がBを獲得したことを確認してください。

グレード頻度相対存在量(%頻度)A... 7... 28%B... 13... 52%C... 3... 12%D... 2... 8%

複雑なデータセットは、間隔に分類する必要がある場合があります

欠点の1つは、度数分布表に表示される複雑なデータセットを理解するのが難しいことです。 大規模なデータセットは、度数分布表を使用して簡単に視覚化できるように、インターバルクラスに分割できます。 たとえば、次の100人に年齢を尋ねると、3人から93人までの幅広い回答が得られる可能性があります。 度数分布表にすべての年齢の行を含めるのではなく、データを0〜10年、11〜20年、21〜30年などの間隔に分類できます。 これは、グループ化された度数分布と呼ばれることもあります。

instagram story viewer

度数分布表は、スキューと尖度を不明瞭にする可能性があります

ヒストグラムに表示されない限り、データの歪度と尖度は度数分布表ではすぐに明らかにならない場合があります。 歪度は、データがどちらの方向に向かうかを示します。 上記の25人の生徒の中間成績の頻度を示すグラフのX軸に成績が表示された場合、分布はAとBに偏ります。 尖度は、データの中央のピークについて教えてくれます。正規分布に沿って落ちるのか、それとも滑らかなベルカーブであるのか、それとも高くて鋭いのかを示します。 この例で中間成績をグラフ化すると、Bに高いピークがあり、低い成績の分布が急激に低下していることがわかります。

Teachs.ru
  • シェア
instagram viewer