클러스터 분석과 요인 분석은 데이터 분석의 두 가지 통계적 방법입니다. 이 두 가지 형태의 분석은 자연 과학과 행동 과학에서 많이 사용됩니다. 클러스터 분석과 요인 분석을 통해 사용자는 분석 유형에 따라 데이터의 일부를 "클러스터"또는 "요인"으로 그룹화 할 수 있습니다. 군집 및 요인 분석 방법을 처음 접하는 일부 연구자들은이 두 가지 유형의 분석이 전반적으로 유사하다고 느낄 수 있습니다. 클러스터 분석과 요인 분석은 표면적으로 비슷해 보이지만 전반적인 목표와 응용 프로그램을 포함하여 여러면에서 다릅니다.
객관적인
군집 분석과 요인 분석의 목표는 다릅니다. 요인 분석의 일반적인 목적은 일련의 데이터에서 상관 관계를 설명하고 변수를 연관시키는 것입니다. 클러스터 분석의 목적은 각 데이터 세트의 이질성을 해결하는 것입니다. 정신적으로 군집 분석은 범주화의 한 형태 인 반면 요인 분석은 단순화의 한 형태입니다.
복잡성
복잡성은 어떤 요인 분석과 군집 분석이 다른지에 대한 한 가지 질문입니다. 데이터 크기는 각 분석에 다르게 영향을 미칩니다. 데이터 세트가 증가하면 클러스터 분석이 계산적으로 다루기 어려워집니다. 이는 군집 분석의 데이터 포인트 수가 가능한 군집 솔루션의 수와 직접 관련이 있기 때문에 사실입니다. 예를 들어 20 개의 개체를 동일한 크기의 4 개 클러스터로 나누는 방법의 수는 4 억 8 천 8 백만이 넘습니다. 이로 인해 요인 분석이 속한 방법 범주를 포함한 직접 계산 방법이 불가능합니다.
해결책
요인 분석 및 군집 분석 문제에 대한 솔루션이 어느 정도 주관적이지만 요인 분석을 통해 연구원은 연구원이 솔루션의 특정 측면 (직교성, 해석 용이성 등)을 최적화 할 수 있다는 의미에서 "최상의"솔루션을 산출합니다. 의 위에). 최상의 클러스터 분석 솔루션을 생성 할 수있는 모든 알고리즘이 계산적으로 비효율적이므로 클러스터 분석에는 그렇지 않습니다. 따라서 클러스터 분석을 사용하는 연구원은 최적의 솔루션을 보장 할 수 없습니다.
응용
요인 분석과 군집 분석은 실제 데이터에 적용되는 방식이 다릅니다. 요인 분석에는 다루기 힘든 변수 집합을 훨씬 더 작은 요인 집합으로 줄이는 기능이 있기 때문에 복잡한 모델을 단순화하는 데 적합합니다. 요인 분석은 또한 연구자가 데이터의 변수가 어떻게 관련되어 있는지에 대한 일련의 가설을 개발할 수있는 확증 적 용도를 가지고 있습니다. 그런 다음 연구원은 데이터 세트에 대해 요인 분석을 실행하여 이러한 가설을 확인하거나 거부 할 수 있습니다. 반면 군집 분석은 특정 기준에 따라 객체를 분류하는 데 적합합니다. 예를 들어, 연구원은 새로 발견 된 식물 그룹의 특정 측면을 측정하고 클러스터 분석을 사용하여 이러한 식물을 종 범주에 배치 할 수 있습니다.