Разница между кластерным и факторным анализом

Кластерный анализ и факторный анализ - два статистических метода анализа данных. Эти две формы анализа широко используются в естествознании и науках о поведении. И кластерный анализ, и факторный анализ позволяют пользователю группировать части данных в «кластеры» или «факторы» в зависимости от типа анализа. Некоторые исследователи, плохо знакомые с методами кластерного и факторного анализа, могут посчитать, что эти два типа анализа в целом схожи. Хотя на первый взгляд кластерный анализ и факторный анализ кажутся схожими, они во многом различаются, в том числе по своим общим целям и приложениям.

Цель

Кластерный анализ и факторный анализ преследуют разные цели. Обычная цель факторного анализа - объяснить корреляцию в наборе данных и связать переменные. друг к другу, в то время как цель кластерного анализа состоит в устранении неоднородности в каждом наборе данных. По сути, кластерный анализ - это форма категоризации, тогда как факторный анализ - это форма упрощения.

Сложность

Сложность - это один вопрос, по которому различаются факторный анализ и кластерный анализ: размер данных влияет на каждый анализ по-разному. По мере роста набора данных кластерный анализ становится сложно поддающимся вычислению. Это верно, потому что количество точек данных в кластерном анализе напрямую связано с количеством возможных кластерных решений. Например, количество способов разделить двадцать объектов на 4 кластера равного размера превышает 488 миллионов. Это делает невозможными прямые вычислительные методы, в том числе ту категорию методов, к которой относится факторный анализ.

Решение

Несмотря на то, что решения задач как факторного анализа, так и кластерного анализа в некоторой степени субъективны, факторный анализ позволяет исследователю дают «лучшее» решение в том смысле, что исследователь может оптимизировать определенный аспект решения (ортогональность, простота интерпретации и т. д. на). Это не так для кластерного анализа, поскольку все алгоритмы, которые могут дать лучшее решение для кластерного анализа, вычислительно неэффективны. Следовательно, исследователи, использующие кластерный анализ, не могут гарантировать оптимальное решение.

Приложения

Факторный анализ и кластерный анализ различаются тем, как они применяются к реальным данным. Поскольку факторный анализ позволяет сократить громоздкий набор переменных до гораздо меньшего набора факторов, он подходит для упрощения сложных моделей. Факторный анализ также имеет подтверждающее использование, при котором исследователь может разработать набор гипотез относительно того, как связаны переменные в данных. Затем исследователь может провести факторный анализ набора данных, чтобы подтвердить или опровергнуть эти гипотезы. С другой стороны, кластерный анализ подходит для классификации объектов по определенным критериям. Например, исследователь может измерить определенные аспекты группы недавно обнаруженных растений и распределить эти растения по категориям видов с помощью кластерного анализа.

  • Доля
instagram viewer