L'analyse factorielle est une méthode statistique pour tenter de trouver ce que l'on appelle des variables latentes lorsque vous disposez de données sur un grand nombre de questions. Les variables latentes sont des choses qui ne peuvent pas être mesurées directement. Par exemple, la plupart des aspects de la personnalité sont latents. Les chercheurs sur la personnalité posent souvent à un échantillon de personnes de nombreuses questions qui, selon eux, sont liées à la personnalité, puis procèdent à une analyse factorielle pour déterminer quels facteurs latents existent.
Les facteurs qui apparaissent ne peuvent provenir que des réponses aux questions que vous posez. Si vous ne posez pas de questions sur les habitudes de sommeil, par exemple, aucun facteur lié aux habitudes de sommeil n'apparaîtra. D'un autre côté, si vous ne posez que des questions sur les habitudes de sommeil, rien d'autre ne peut apparaître. La sélection d'un bon ensemble de questions est compliquée, et différents chercheurs choisiront différents ensembles de questions.
Si vous générez beaucoup de nombres aléatoires, une analyse factorielle peut toujours trouver une structure apparente dans les données. Il est difficile de dire si les facteurs qui émergent reflètent les données ou font simplement partie de la puissance de l'analyse factorielle pour trouver des modèles.
L'une des tâches de l'analyste factoriel consiste à décider du nombre de facteurs à conserver. Il existe une variété de méthodes pour déterminer cela, et il y a peu d'accord sur celle qui est la meilleure.
L'analyse factorielle peut vous indiquer quelles variables de votre ensemble de données « s'associent » d'une manière qui n'est pas toujours évidente. Mais interpréter ce que ces ensembles de variables représentent réellement relève de l'analyste, et des personnes raisonnables peuvent ne pas être d'accord.