グループ化度数分布表は、大量のデータセットをより小さな「グループ」に編成および簡略化するための統計手法です。 データが数百の値で構成されている場合は、それらをより小さなチャンクにグループ化して、より多くの値にすることが望ましいです。 理解できる。 グループ化された度数分布表が作成されると、科学者と統計学者はデータの興味深い傾向を観察できます。
グループ化度数分布表の主な目的は、データ全体の各グループ内で各値が発生した頻度を調べることです。 グループ度数分布は、基本的に2列のテーブルです。 「グループ」というタイトルの最初の列は、データのすべての可能な「グループ化」を表し、「頻度」というタイトルの2番目の列は、各グループ内で各値が発生した頻度を表します。
一枚の紙にそれを書くことによってデータを収集します。 たとえば、16、17、18、19、10、11、13、14、17、11、12、15の12個の値で構成されるデータがあるとします。
最小の番号で始まり、最大の番号で終わるようにデータを再配置します。 この例では、このデータは次のように再配置されます:10、11、11、12、13、14、15、16、17、17、18、および19。
最高値と最低値を見つけて、最高値から最低値を差し引きます。 この例では、「19」の最大値から「10」の最小値を差し引きます。 結果は19-10 = 9です。
グループの数を決定します。 ほとんどのデータには5〜10のグループがあります。 データのグループ数を選択するのはあなたの決定です。 この例では、値が12しかないため、合計5つのグループを選択します。
グループ間隔の幅を決定します。 幅は、単にグループごとの値の数を意味します。 グループの幅は、ステップ3をステップ4で割ることによって得られます。 この例では、「9」を「5」で割ったものです。 結果は1.8または9/5 = 1.8です。 1.8を2に切り上げます。 このステップで、グループごとに2つの値しかないことを確認しました。
2つの列を作成します。 最初の列に「グループ」というタイトルを付けます。 最初の列は、データの5つのグループすべてを表します。 2番目の列に「頻度」というタイトルを付けます。 2番目の列は、グループごとに各値が発生した「頻度」を表します。
グループの最初の列に5つのグループすべてを作成します。 各グループの幅は「2」であるため、この例では、最初のグループは10〜11になります。 この最初のグループには2つの値があります。 最初の値は10で、2番目の値は11です。 引き続き5つのグループすべてを作成します。 5つのグループはすべて次のようになります。
10-11 12-13 14-15 16-17 18-19
データを集計して、5つのグループすべての頻度を決定します。 この例では、最初のグループは10〜11であり、このグループに含まれる値の数を集計して確認します。 10-11の最初のグループの下に、3つの値(10,11,11)が含まれていることがわかります。 「FrequencyColumn」の下に3つ書きます。 残りの4つのグループの集計を続けます。 5つのグループすべてを完了し、その頻度を集計すると、度数分布表が完成します。
最終テーブルは次のようになります。
グループ頻度10-113
12-13 2 14-15 2 16-17 3 18-19 2
チップ
手順2でデータを並べ替えると、度数分布表を簡単に作成できます。 常にデータを再配置してください。 Excelスプレッドシートを使用して、最初にランダムデータを入力し、次に[昇順で並べ替え]ボタンをクリックして、データを並べ替えることができます。