クラスタリング分析で重心を見つける方法

クラスター分析は、同様の特性に基づいてデータを代表的なグループに編成する方法です。クラスターの各メンバーは、他のグループのメンバーよりも、同じクラスターの他のメンバーとの共通点が多くなっています。グループ内の最も代表的なポイントは図心と呼ばれます。通常、これはクラスター内のデータポイントの値の平均です。

データを整理します。データが単一の変数で構成されている場合は、ヒストグラムが適切な場合があります。 2つの変数が関係する場合は、座標平面にデータをグラフ化します。たとえば、教室で学童の身長と体重を見ている場合は、次の点をプロットします。グラフ上の各子のデータ。重みは横軸、身長は縦軸です。軸。 3つ以上の変数が含まれる場合、データを表示するために行列が必要になる場合があります。

データをクラスターにグループ化します。各クラスターは、それに最も近いデータポイントで構成されている必要があります。身長と体重の例では、互いに接近しているように見えるデータのポイントをグループ化します。クラスターの数、およびデータのすべてのポイントがクラスター内にある必要があるかどうかは、調査の目的によって異なる場合があります。

クラスターごとに、すべてのメンバーの値を追加します。たとえば、データのクラスターがポイント（80、56）、（75、53）、（60、50）、および（68,54）で構成されている場合、値の合計は（283、213）になります。

合計をクラスターのメンバー数で割ります。上記の例では、283を4で割ると70.75になり、213を4で割ると53.25になるため、クラスターの重心は（70.75、53.25）になります。

クラスターの重心をプロットし、自分のクラスターの重心よりも別のクラスターの重心に近い点があるかどうかを判断します。いずれかのポイントが別の重心に近い場合は、近い重心を含むクラスターにそれらを再配布します。

データのすべてのポイントが、それらが最も近い重心を含むクラスター内にあるまで、ステップ3、4、および5を繰り返します。

クラスタリング分析で重心を見つける方法

カテゴリ

Minitabでパレート図を設定する方法

クラスタリング分析で重心を見つける方法

申し込む

カテゴリ

Minitabでパレート図を設定する方法