Cómo encontrar el coeficiente de correlación para 'R' en un gráfico de dispersión

Encontrar la fuerza de la asociación entre dos variables es una habilidad importante para los científicos de todo tipo. Si dos variables están correlacionadas entre sí, muestra que existe un vínculo entre ellas. Una correlación positiva significa que cuando una variable aumenta, la otra también lo hace, y una correlación negativa significa que cuando una variable aumenta, la otra disminuye. Las correlaciones no prueban la causalidad, aunque es posible que más pruebas demuestren una relación causal entre las variables. El coeficiente de correlación R muestra la fuerza de la relación entre las dos variables y si es una correlación positiva o negativa.

Haz una tabla con tus datos. Esto debe incluir una columna para el número de participante, una columna para la primera variable (etiquetada X) y una columna para la segunda variable (etiquetada y). Por ejemplo, si busca ver si existe una correlación entre la altura y el tamaño del zapato, una columna sería identifique a cada persona que mida, una columna mostraría la altura de cada persona y otra mostraría su talla de zapato. Haga tres columnas adicionales, una para

instagram story viewer
xy, uno para X2 y uno para y2.

Utilice sus datos para completar las tres columnas adicionales. Por ejemplo, imagina que tu primera persona mide 75 pulgadas de alto y tiene un tamaño de 12 pies. La X (altura) mostraría 75, y la y La columna (talla de zapato) mostraría 12. Necesitas encontrar xy, X2 y y2. Entonces, usando este ejemplo:

xy = 75 × 12 = 900

X2 = 752 = 5,625

y2 = 122 = 144

Complete estos cálculos para cada persona de la que tenga datos.

Cree una nueva fila en la parte inferior de su tabla para las sumas de cada columna. Suma todos los X valores, todos los y valores, todos los xy valores, todos los X2 valores y todos los y2 valores y luego coloque los resultados en la parte inferior de la columna correspondiente en su nueva fila. Puede etiquetar su nueva fila como "suma" o usar un símbolo sigma (Σ).

Tu encuentras R a partir de sus datos utilizando la fórmula:

R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx2- (Σx)2] [nΣy2- (Σy)2]}

Esto parece un poco abrumador, por lo que puede dividirlo en dos partes, que llamaremos s y t.

s = n (Σxy) - (Σx) (Σy)

t = √ {[n Σx2- (Σx)2] [n Σy2- (Σy)2]}

En estas ecuaciones, norte es el número de participantes que tiene (su tamaño de muestra). El resto de las partes de la ecuación son las sumas que calculó en el último paso. Así que para s, multiplique el tamaño de su muestra por la suma de los xy columna, y luego reste la suma de la X columna multiplicada por la suma de la y columna de este.

Para t, hay cuatro pasos principales. Primero, calcula norte multiplicado por la suma de tus X2 columna, y luego reste la suma de su X columna al cuadrado (multiplicada por sí misma) a partir de este valor. En segundo lugar, haz exactamente lo mismo pero con la suma de y2 columna y la suma de la y columna al cuadrado en lugar de la X partes (es decir, n × Σy2 - [Σy × Σy]). En tercer lugar, multiplique estos dos resultados (para Xarena ys) juntos. Cuarto, saca la raíz cuadrada de esta respuesta.

Si ha trabajado en partes, puede calcular R tan simplemente R = s ÷ t. Obtendrá una respuesta entre -1 y 1. Una respuesta positiva muestra una correlación positiva, y cualquier valor superior a 0,7 generalmente se considera una relación sólida. Una respuesta negativa muestra una correlación negativa, y cualquier valor superior a -0,7 se considera una fuerte relación negativa. De manera similar, ± 0.5 se considera una relación moderada y ± 0.3 se considera una relación débil. Cualquier valor cercano a 0 muestra una falta de correlación.

Teachs.ru
  • Cuota
instagram viewer