Кластерний аналіз та факторний аналіз - два статистичні методи аналізу даних. Ці дві форми аналізу широко використовуються в природничих та поведінкових науках. Кластерний аналіз і факторний аналіз дозволяють користувачеві групувати частини даних у "кластери" або за "факторами", залежно від типу аналізу. Деякі дослідники, що знайомі з методами кластерного та факторного аналізу, можуть вважати, що ці два типи аналізу загалом схожі. Хоча кластерний аналіз та факторний аналіз здаються схожими на перший погляд, вони різняться багатьма способами, в тому числі загальними цілями та застосуваннями.
Об’єктивна
Кластерний аналіз та факторний аналіз мають різні цілі. Звичайна мета факторного аналізу - пояснити кореляцію в наборі даних і пов'язати змінні один одному, тоді як мета кластерного аналізу полягає у вирішенні питань неоднорідності у кожному наборі даних. За духом кластерний аналіз є формою категоризації, тоді як факторний аналіз - формою спрощення.
Складність
Складність - це одне питання, щодо якого факторного аналізу та кластерного аналізу відрізняються: розмір даних по-різному впливає на кожен аналіз. У міру зростання набору даних кластерний аналіз стає обчислювально нерозв'язним. Це правда, оскільки кількість точок даних при кластерному аналізі безпосередньо пов’язана з кількістю можливих кластерних рішень. Наприклад, кількість способів розділити двадцять об’єктів на 4 кластери однакового розміру становить понад 488 мільйонів. Це унеможливлює прямі обчислювальні методи, включаючи категорію методів, до яких належить факторний аналіз.
Рішення
Незважаючи на те, що рішення як факторного аналізу, так і кластерного аналізу є певною мірою суб'єктивними, факторний аналіз дозволяє досліднику зробити це дати «найкраще» рішення в тому сенсі, що дослідник може оптимізувати певний аспект рішення (ортогональність, простота інтерпретації тощо). увімкнено). Це не так для кластерного аналізу, оскільки всі алгоритми, які могли б дати найкраще рішення кластерного аналізу, є обчислювально неефективними. Отже, дослідники, що використовують кластерний аналіз, не можуть гарантувати оптимального рішення.
Програми
Факторний аналіз та кластерний аналіз відрізняються тим, як вони застосовуються до реальних даних. Оскільки факторний аналіз має можливість звести громіздкий набір змінних до значно меншого набору факторів, він підходить для спрощення складних моделей. Факторний аналіз також має підтверджуюче використання, в рамках якого дослідник може сформувати набір гіпотез щодо того, як змінні в даних пов'язані. Потім дослідник може провести факторний аналіз набору даних, щоб підтвердити або спростувати ці гіпотези. Кластерний аналіз, навпаки, підходить для класифікації об’єктів за певними критеріями. Наприклад, дослідник може виміряти певні аспекти групи нещодавно відкритих рослин і віднести ці рослини до категорій видів, використовуючи кластерний аналіз.