A diferença entre análise de cluster e fator

A análise de agrupamento e a análise fatorial são dois métodos estatísticos de análise de dados. Essas duas formas de análise são amplamente utilizadas nas ciências naturais e do comportamento. Tanto a análise de cluster quanto a análise fatorial permitem ao usuário agrupar partes dos dados em "clusters" ou em "fatores", dependendo do tipo de análise. Alguns pesquisadores novos nos métodos de análise de agrupamento e fatorial podem sentir que esses dois tipos de análise são semelhantes em geral. Embora a análise de cluster e a análise fatorial pareçam semelhantes na superfície, elas diferem em muitos aspectos, inclusive em seus objetivos e aplicações gerais.

Objetivo

A análise de agrupamento e a análise fatorial têm objetivos diferentes. O objetivo usual da análise fatorial é explicar a correlação em um conjunto de dados e relacionar variáveis entre si, enquanto o objetivo da análise de cluster é abordar a heterogeneidade em cada conjunto de dados. Em espírito, a análise de cluster é uma forma de categorização, enquanto a análise fatorial é uma forma de simplificação.

Complexidade

A complexidade é uma questão na qual a análise fatorial e a análise de cluster diferem: o tamanho dos dados afeta cada análise de maneira diferente. Conforme o conjunto de dados cresce, a análise de cluster torna-se computacionalmente intratável. Isso ocorre porque o número de pontos de dados na análise de cluster está diretamente relacionado ao número de soluções de cluster possíveis. Por exemplo, o número de maneiras de dividir vinte objetos em 4 grupos de igual tamanho é superior a 488 milhões. Isso torna os métodos computacionais diretos, incluindo a categoria de métodos aos quais a análise fatorial pertence, impossíveis.

Solução

Mesmo que as soluções para os problemas de análise fatorial e análise de cluster sejam subjetivas em algum grau, a análise fatorial permite que um pesquisador produzir uma solução “melhor”, no sentido de que o pesquisador pode otimizar um determinado aspecto da solução (ortogonalidade, facilidade de interpretação e assim sobre). Isso não é verdade para a análise de cluster, uma vez que todos os algoritmos que poderiam gerar uma melhor solução de análise de cluster são computacionalmente ineficientes. Conseqüentemente, os pesquisadores que empregam a análise de cluster não podem garantir uma solução ótima.

Formulários

A análise fatorial e a análise de cluster diferem na forma como são aplicadas aos dados reais. Como a análise fatorial tem a capacidade de reduzir um conjunto pesado de variáveis ​​a um conjunto muito menor de fatores, ela é adequada para simplificar modelos complexos. A análise fatorial também tem um uso confirmatório, no qual o pesquisador pode desenvolver um conjunto de hipóteses a respeito de como as variáveis ​​nos dados estão relacionadas. O pesquisador pode então executar a análise fatorial no conjunto de dados para confirmar ou negar essas hipóteses. A análise de cluster, por outro lado, é adequada para classificar objetos de acordo com certos critérios. Por exemplo, um pesquisador pode medir certos aspectos de um grupo de plantas recém-descobertas e colocar essas plantas em categorias de espécies, empregando a análise de agrupamento.

  • Compartilhar
instagram viewer