تحليل الكتلة هو طريقة لتنظيم البيانات في مجموعات تمثيلية بناءً على خصائص متشابهة. كل عضو في الكتلة لديه قواسم مشتركة مع أعضاء آخرين في نفس المجموعة أكثر من أعضاء المجموعات الأخرى. النقطة الأكثر تمثيلا داخل المجموعة تسمى النقطه الوسطى. عادة ، هذا هو متوسط قيم نقاط البيانات في الكتلة.
تنظيم البيانات. إذا كانت البيانات تتكون من متغير واحد ، فقد يكون الرسم البياني مناسبًا. إذا تم تضمين متغيرين ، فقم برسم البيانات على مستوى إحداثي. على سبيل المثال ، إذا كنت تنظر إلى طول ووزن أطفال المدرسة في الفصل الدراسي ، فقم برسم نقاط بيانات لكل طفل على الرسم البياني ، حيث يكون الوزن هو المحور الأفقي والارتفاع يمثل المحور الرأسي محور. إذا تم تضمين أكثر من متغيرين ، فقد تكون هناك حاجة إلى مصفوفات لعرض البيانات.
تجميع البيانات في مجموعات. يجب أن تتكون كل مجموعة من نقاط البيانات الأقرب إليها. في مثال الطول والوزن ، قم بتجميع أي نقاط من البيانات تبدو قريبة من بعضها. قد يعتمد عدد المجموعات ، وما إذا كان يجب أن تكون كل نقطة من البيانات في مجموعة ، على أغراض الدراسة.
لكل مجموعة ، أضف قيم جميع الأعضاء. على سبيل المثال ، إذا كانت مجموعة البيانات تتكون من النقاط (80 ، 56) ، (75 ، 53) ، (60 ، 50) ، و (68 ، 54) ، فسيكون مجموع القيم (283 ، 213).
قسّم الإجمالي على عدد أعضاء الكتلة. في المثال أعلاه ، 283 مقسومًا على أربعة يساوي 70.75 ، و 213 مقسومًا على أربعة يساوي 53.25 ، وبالتالي فإن النقطه الوسطى للعنقود هي (70.75 ، 53.25).
ارسم النقط الوسطى العنقودية وحدد ما إذا كانت أي نقاط أقرب إلى النقطه الوسطى من عنقود آخر مما هي عليه إلى النقطه الوسطى من المجموعة الخاصة بهم. إذا كانت أي نقاط أقرب إلى النقطه الوسطى مختلفة ، فأعد توزيعها على الكتلة التي تحتوي على النقطه الوسطى الأقرب.
كرر الخطوات 3 و 4 و 5 حتى تصبح جميع نقاط البيانات في المجموعة التي تحتوي على النقطه الوسطى الأقرب إليها.