Contenido
Encontrar la fuerza de la asociación entre dos variables es una habilidad importante para los científicos de todo tipo. Si dos variables están correlacionadas entre sí, muestra que hay un vínculo entre ellas. Una correlación positiva significa que cuando una variable aumenta, la otra también lo hace, y una correlación negativa significa que cuando una variable aumenta, la otra disminuye. Las correlaciones no prueban la causalidad, aunque es posible que otras pruebas demuestren una relación causal entre las variables. El coeficiente de correlación R muestra la fuerza de la relación entre las dos variables y si se trata de una correlación positiva o negativa.
TL; DR (demasiado largo; no leído)
Llamar a una variable X y una variable y. Calcule el valor de R usando la fórmula:
R = ÷ √ {}
Dónde norte es el tamaño de tu muestra
Haz una tabla de tus datos. Esto debe incluir una columna para el número de participante, una columna para la primera variable (etiquetada X) y una columna para la segunda variable (etiquetada y) Por ejemplo, si está buscando ver si hay una correlación entre la altura y el tamaño del zapato, una columna identificará a cada persona que mida, una columna mostrará la altura de cada persona y otra mostrará el tamaño de su zapato. Haga tres columnas adicionales, una para xy, uno para X2 y uno para y2.
Use sus datos para completar las tres columnas adicionales. Por ejemplo, imagine que su primera persona mide 75 pulgadas de alto y tiene un tamaño de 12 pies. los X (altura) columna mostraría 75, y la y (tamaño del zapato) la columna mostraría 12. Necesitas encontrar xy, X2 y y2. Entonces, usando este ejemplo:
xy = 75 × 12 = 900
X2 = 752 = 5,625
y2 = 122 = 144
Complete estos cálculos para cada persona para la que tenga datos.
Cree una nueva fila en la parte inferior de su tabla para las sumas de cada columna. Sume todos los X valores, todos los y valores, todos los xy valores, todos los X2 valores y todos los y2 valores, y luego coloque los resultados en la parte inferior de la columna correspondiente en su nueva fila. Puede etiquetar su nueva fila como "suma" o usar un símbolo sigma (Σ).
Tu encuentras R de sus datos usando la fórmula:
R = ÷ √ {}
Esto parece un poco desalentador, por lo que puede dividirlo en dos partes, que llamaremos s y t.
s = n (Σxy) - (Σx) (Σy)
t = √ {}
En estas ecuaciones, norte es la cantidad de participantes que tiene (el tamaño de su muestra). El resto de las partes de la ecuación son las sumas que calculó en el último paso. Entonces para s, multiplique el tamaño de su muestra por la suma de xy columna, y luego reste la suma de X columna multiplicada por la suma de la y columna de esto.
por t, hay cuatro pasos principales. Primero, calcule norte multiplicado por la suma de tu X2 columna, y luego reste la suma de su X columna al cuadrado (multiplicada por sí misma) a partir de este valor. Segundo, haz exactamente lo mismo pero con la suma de y2 columna y la suma de la y columna al cuadrado en lugar de la X partes (es decir, n × Σy2 -). Tercero, multiplique estos dos resultados (para el Xs y ys) juntos. Cuarto, toma la raíz cuadrada de esta respuesta.
Si ha trabajado en partes, puede calcular R como simplemente R = s ÷ t. Obtendrá una respuesta entre −1 y 1. Una respuesta positiva muestra una correlación positiva, con cualquier cosa por encima de 0.7 generalmente se considera una relación fuerte. Una respuesta negativa muestra una correlación negativa, con algo por encima de -0.7 considerado una fuerte relación negativa. Del mismo modo, ± 0.5 se considera una relación moderada y ± 0.3 se considera una relación débil. Cualquier cosa cercana a 0 muestra una falta de correlación.