Come trovare il centroide in un'analisi di clustering

L'analisi cluster è un metodo per organizzare i dati in gruppi rappresentativi basati su caratteristiche simili. Ogni membro del cluster ha più cose in comune con gli altri membri dello stesso cluster che con i membri degli altri gruppi. Il punto più rappresentativo all'interno del gruppo è detto baricentro. Di solito, questa è la media dei valori dei punti di dati nel cluster.

Organizza i dati. Se i dati sono costituiti da una singola variabile, potrebbe essere appropriato un istogramma. Se sono coinvolte due variabili, rappresentare graficamente i dati su un piano di coordinate. Ad esempio, se stavi osservando l'altezza e il peso degli scolari in una classe, traccia i punti di dati per ogni bambino su un grafico, con il peso che è l'asse orizzontale e l'altezza è il verticale asse. Se sono coinvolte più di due variabili, potrebbero essere necessarie matrici per visualizzare i dati.

Raggruppare i dati in cluster. Ogni cluster dovrebbe essere costituito dai punti di dati più vicini ad esso. Nell'esempio altezza e peso, raggruppa tutti i punti di dati che sembrano vicini. Il numero di cluster e se ogni punto di dati deve trovarsi in un cluster può dipendere dagli scopi dello studio.

instagram story viewer

Per ogni cluster, aggiungi i valori di tutti i membri. Ad esempio, se un cluster di dati fosse costituito dai punti (80, 56), (75, 53), (60, 50) e (68,54), la somma dei valori sarebbe (283, 213).

Dividere il totale per il numero di membri del cluster. Nell'esempio sopra, 283 diviso per quattro è 70,75 e 213 diviso per quattro è 53,25, quindi il centroide del cluster è (70,75, 53,25).

Tracciare i centroidi del cluster e determinare se alcuni punti sono più vicini a un centroide di un altro cluster rispetto al centroide del proprio cluster. Se alcuni punti sono più vicini a un centroide diverso, ridistribuiscili al cluster contenente il centroide più vicino.

Ripetere i passaggi 3, 4 e 5 finché tutti i punti di dati non si trovano nel cluster contenente il centroide a cui sono più vicini.

Teachs.ru
  • Condividere
instagram viewer