Kümeleme Analizinde Centroid Nasıl Bulunur?

Kümeleme analizi, verileri benzer özelliklere dayalı olarak temsili gruplar halinde düzenleme yöntemidir. Kümenin her bir üyesinin, aynı kümenin diğer üyeleriyle, diğer grupların üyelerinden daha fazla ortak noktası vardır. Grup içindeki en temsili noktaya ağırlık merkezi denir. Genellikle bu, kümedeki veri noktalarının değerlerinin ortalamasıdır.

Verileri düzenleyin. Veriler tek bir değişkenden oluşuyorsa, bir histogram uygun olabilir. İki değişken söz konusuysa, verileri bir koordinat düzleminde çizin. Örneğin, bir sınıftaki okul çocuklarının boy ve kilosuna bakıyorsanız, aşağıdaki noktaları çizin. ağırlık yatay eksen ve yükseklik dikey olacak şekilde grafikteki her çocuk için veri eksen. İkiden fazla değişken söz konusuysa, verileri görüntülemek için matrislere ihtiyaç duyulabilir.

Verileri kümeler halinde gruplandırın. Her küme, kendisine en yakın veri noktalarından oluşmalıdır. Boy ve kilo örneğinde, birbirine yakın görünen tüm veri noktalarını gruplayın. Kümelerin sayısı ve her veri noktasının bir kümede olması gerekip gerekmediği, çalışmanın amaçlarına bağlı olabilir.

instagram story viewer

Her küme için tüm üyelerin değerlerini ekleyin. Örneğin, bir veri kümesi (80, 56), (75, 53), (60, 50) ve (68,54) noktalarından oluşuyorsa, değerlerin toplamı (283, 213) olacaktır.

Toplamı kümenin üye sayısına bölün. Yukarıdaki örnekte, 283'ün dörde bölünmesi 70.75'tir ve 213'ün dörde bölünmesi 53.25'tir, dolayısıyla kümenin ağırlık merkezi (70.75, 53.25)'dir.

Küme ağırlık merkezlerini çizin ve herhangi bir noktanın başka bir kümenin merkez merkezine, kendi kümelerinin merkezine olduğundan daha yakın olup olmadığını belirleyin. Herhangi bir nokta farklı bir ağırlık merkezine daha yakınsa, bunları daha yakın ağırlık merkezini içeren kümeye yeniden dağıtın.

Tüm veri noktaları en yakın oldukları ağırlık merkezini içeren kümede olana kadar Adım 3, 4 ve 5'i tekrarlayın.

Teachs.ru
  • Paylaş
instagram viewer