Cómo encontrar el centroide en un análisis de agrupamiento

El análisis de conglomerados es un método para organizar datos en grupos representativos basados ​​en características similares. Cada miembro del grupo tiene más en común con otros miembros del mismo grupo que con los miembros de los otros grupos. El punto más representativo dentro del grupo se llama centroide. Por lo general, esta es la media de los valores de los puntos de datos del conglomerado.

Organiza los datos. Si los datos constan de una sola variable, un histograma podría ser apropiado. Si hay dos variables involucradas, grafique los datos en un plano de coordenadas. Por ejemplo, si estuviera observando la altura y el peso de los niños en edad escolar en un aula, grafique los puntos de datos para cada niño en un gráfico, siendo el peso el eje horizontal y la altura el vertical eje. Si están involucradas más de dos variables, es posible que se necesiten matrices para mostrar los datos.

Agrupe los datos en grupos. Cada grupo debe constar de los puntos de datos más cercanos a él. En el ejemplo de altura y peso, agrupe los puntos de datos que parezcan estar muy juntos. El número de conglomerados, y si cada punto de datos debe estar en un conglomerado, puede depender de los propósitos del estudio.

instagram story viewer

Para cada grupo, agregue los valores de todos los miembros. Por ejemplo, si un grupo de datos estuviera formado por los puntos (80, 56), (75, 53), (60, 50) y (68,54), la suma de los valores sería (283, 213).

Divida el total por el número de miembros del grupo. En el ejemplo anterior, 283 dividido por cuatro es 70,75 y 213 dividido por cuatro es 53,25, por lo que el centroide del grupo es (70,75, 53,25).

Grafique los centroides del grupo y determine si algún punto está más cerca de un centroide de otro grupo que del centroide de su propio grupo. Si algún punto está más cerca de un centroide diferente, redistribuirlo al grupo que contiene el centroide más cercano.

Repita los pasos 3, 4 y 5 hasta que todos los puntos de datos estén en el grupo que contiene el centroide al que están más cerca.

Teachs.ru
  • Cuota
instagram viewer