La différence entre les analyses bivariées et multivariées

Les analyses bivariées et multivariées sont des méthodes statistiques pour étudier les relations entre les échantillons de données. L'analyse bivariée examine deux ensembles de données appariés, en étudiant s'il existe une relation entre eux. L'analyse multivariée utilise deux ou plusieurs variables et analyses qui, le cas échéant, sont corrélées à un résultat spécifique. L'objectif dans ce dernier cas est de déterminer quelles variables influencent ou causent le résultat.

L'analyse bivariée étudie la relation entre deux ensembles de données, avec une paire d'observations provenant d'un seul échantillon ou individu. Cependant, chaque échantillon est indépendant. Vous analysez les données à l'aide d'outils tels que les tests t et les tests du chi carré, pour voir si les deux groupes de données sont en corrélation. Si les variables sont quantitatives, vous les représentez généralement sur un nuage de points. L'analyse bivariée examine également la force de toute corrélation.

Un exemple d'analyse bivariée est une équipe de recherche enregistrant l'âge du mari et de la femme dans un mariage unique. Ces données sont appariées car les deux âges proviennent du même mariage, mais indépendantes car l'âge d'une personne n'entraîne pas l'âge d'une autre personne. Vous tracez les données pour montrer une corrélation: les maris plus âgés ont des femmes plus âgées. Un deuxième exemple est l'enregistrement des mesures de la force de préhension et de la force des bras des individus. Les données sont appariées car les deux mesures proviennent d'une même personne, mais indépendantes car différents muscles sont utilisés. Vous tracez les données de nombreuses personnes pour montrer une corrélation: les personnes ayant une force de préhension plus élevée ont une force de bras plus élevée.

L'analyse multivariée examine plusieurs variables pour voir si une ou plusieurs d'entre elles sont prédictives d'un certain résultat. Les variables prédictives sont des variables indépendantes et le résultat est la variable dépendante. Les variables peuvent être continues, ce qui signifie qu'elles peuvent avoir une plage de valeurs, ou elles peuvent être dichotomiques, ce qui signifie qu'elles représentent la réponse à une question par oui ou par non. L'analyse de régression multiple est la méthode la plus couramment utilisée dans l'analyse multivariée pour trouver des corrélations entre les ensembles de données. D'autres incluent la régression logistique et l'analyse multivariée de la variance.

Une analyse multivariée a été utilisée par des chercheurs dans une étude du Journal of Pediatrics de 2009 pour déterminer si des résultats négatifs les événements de la vie, l'environnement familial, la violence familiale, la violence dans les médias et la dépression sont des prédicteurs de l'agressivité des jeunes et intimidation. Dans ce cas, événements de vie négatifs, environnement familial, violence familiale, violence médiatique et dépression étaient les variables prédictives indépendantes, et l'agressivité et l'intimidation étaient les résultats dépendants variables. Plus de 600 sujets, avec un âge moyen de 12 ans, ont reçu des questionnaires pour déterminer les variables prédictives pour chaque enfant. Une enquête a également déterminé les variables de résultat pour chaque enfant. Des équations de régression multiple et une modélisation par équation structurelle ont été utilisées pour étudier l'ensemble de données. Les événements négatifs de la vie et la dépression se sont révélés être les principaux prédicteurs de l'agressivité chez les jeunes.

  • Partager
instagram viewer