Różnica między analizą skupień a analizą czynnikową

Analiza skupień i analiza czynnikowa to dwie statystyczne metody analizy danych. Te dwie formy analizy są intensywnie wykorzystywane w naukach przyrodniczych i behawioralnych. Zarówno analiza skupień, jak i analiza czynnikowa umożliwiają użytkownikowi grupowanie części danych w „klastry” lub „czynniki”, w zależności od typu analizy. Niektórzy badacze, którzy nie znają metod analizy skupień i analiz czynnikowych, mogą uważać, że te dwa rodzaje analizy są ogólnie podobne. Chociaż analiza skupień i analiza czynnikowa wydają się na pozór podobne, różnią się pod wieloma względami, w tym pod względem ogólnych celów i zastosowań.

Cel

Analiza skupień i analiza czynnikowa mają różne cele. Zwykłym celem analizy czynnikowej jest wyjaśnienie korelacji w zestawie danych i powiązanie zmiennych sobie nawzajem, podczas gdy celem analizy skupień jest uwzględnienie niejednorodności w każdym zestawie danych. W duchu analiza skupień jest formą kategoryzacji, natomiast analiza czynnikowa jest formą uproszczenia.

Złożoność

Złożoność jest jednym z pytań, w którym analiza czynnikowa i analiza skupień różnią się: rozmiar danych wpływa na każdą analizę inaczej. Wraz ze wzrostem zestawu danych analiza skupień staje się niewykonalna obliczeniowo. Dzieje się tak, ponieważ liczba punktów danych w analizie skupień jest bezpośrednio związana z liczbą możliwych rozwiązań klastrowych. Na przykład liczba sposobów podzielenia dwudziestu obiektów na 4 skupiska równej wielkości wynosi ponad 488 milionów. Uniemożliwia to stosowanie bezpośrednich metod obliczeniowych, w tym kategorii metod, do których należy analiza czynnikowa.

Rozwiązanie

Choć rozwiązania problemów zarówno analizy czynnikowej, jak i analizy skupień są do pewnego stopnia subiektywne, analiza czynnikowa pozwala badaczowi: dają „najlepsze” rozwiązanie, w tym sensie, że badacz może zoptymalizować pewien aspekt rozwiązania (ortogonalność, łatwość interpretacji itp. na). Inaczej jest w przypadku analizy skupień, ponieważ wszystkie algorytmy, które mogłyby dać najlepsze rozwiązanie do analizy skupień, są niewydajne obliczeniowo. Dlatego badacze stosujący analizę skupień nie mogą zagwarantować optymalnego rozwiązania.

Aplikacje

Analiza czynnikowa i analiza skupień różnią się sposobem zastosowania do danych rzeczywistych. Ponieważ analiza czynnikowa umożliwia zredukowanie niewygodnego zestawu zmiennych do znacznie mniejszego zestawu czynników, nadaje się do upraszczania złożonych modeli. Analiza czynnikowa ma również zastosowanie potwierdzające, w którym badacz może opracować zestaw hipotez dotyczących powiązania zmiennych w danych. Badacz może następnie przeprowadzić analizę czynnikową zestawu danych, aby potwierdzić lub zaprzeczyć tym hipotezom. Z kolei analiza skupień nadaje się do klasyfikowania obiektów według określonych kryteriów. Na przykład badacz może mierzyć pewne aspekty grupy nowo odkrytych roślin i umieszczać je w kategoriach gatunkowych, stosując analizę skupień.

  • Dzielić
instagram viewer