Rozdíl mezi klastrovou a faktorovou analýzou

Klastrová analýza a faktorová analýza jsou dvě statistické metody analýzy dat. Tyto dvě formy analýzy jsou hojně využívány v přírodních vědách a vědách o chování. Klastrová analýza i faktorová analýza umožňují uživateli seskupit části dat do „klastrů“ nebo do „faktorů“ v závislosti na typu analýzy. Někteří vědci, kteří začínají s metodami klastrových a faktorových analýz, mohou mít pocit, že tyto dva typy analýz jsou celkově podobné. Zatímco se klastrová analýza a faktorová analýza zdají na první pohled podobné, liší se v mnoha ohledech, včetně jejich celkových cílů a aplikací.

Objektivní

Klastrová analýza a faktorová analýza mají různé cíle. Obvyklým cílem faktorové analýzy je vysvětlit korelaci v souboru dat a související proměnné navzájem, zatímco cílem klastrové analýzy je řešit heterogenitu v každé sadě dat. V duchu je shluková analýza formou kategorizace, zatímco faktorová analýza je formou zjednodušení.

Složitost

Složitost je jedna otázka, na které se liší faktorová analýza a klastrová analýza: velikost dat ovlivňuje každou analýzu odlišně. Jak množina dat roste, stává se klastrová analýza výpočetně neřešitelná. To je pravda, protože počet datových bodů v klastrové analýze přímo souvisí s počtem možných klastrových řešení. Například počet způsobů, jak rozdělit dvacet objektů na 4 shluky stejné velikosti, je více než 488 milionů. To znemožňuje přímé výpočetní metody, včetně kategorie metod, do které patří faktorová analýza.

instagram story viewer

Řešení

I když jsou řešení problémů s faktorovou analýzou i s klastrovou analýzou do jisté míry subjektivní, faktorová analýza umožňuje výzkumníkovi přinést „nejlepší“ řešení v tom smyslu, že výzkumný pracovník může optimalizovat určitý aspekt řešení (ortogonalita, snadná interpretace atd. na). To neplatí pro klastrovou analýzu, protože všechny algoritmy, které by mohly přinést nejlepší řešení klastrové analýzy, jsou výpočetně neefektivní. Výzkumníci využívající klastrovou analýzu proto nemohou zaručit optimální řešení.

Aplikace

Faktorová analýza a klastrová analýza se liší v tom, jak jsou aplikovány na reálná data. Protože faktorová analýza má schopnost redukovat nepraktickou sadu proměnných na mnohem menší sadu faktorů, je vhodná pro zjednodušení složitých modelů. Faktorová analýza má také potvrzující použití, při kterém může výzkumník vyvinout soubor hypotéz týkajících se vztahu proměnných v datech. Výzkumník pak může provést analýzu faktorů na souboru dat, aby tyto hypotézy potvrdil nebo vyvrátil. Clusterová analýza je naopak vhodná pro klasifikaci objektů podle určitých kritérií. Výzkumník může například měřit určité aspekty skupiny nově objevených rostlin a pomocí shlukové analýzy je umístit do kategorií druhů.

Teachs.ru
  • Podíl
instagram viewer