calculo.cc calculo.cc

Correlación lineal

El coeficiente de correlación lineal o coeficiente de Pearson, r , es una medida de la variable(X, Y) que determina el grado de dependencia lineal entre las variables X e Y.
Utilizando la fórmula:

-Donde σxy es la covarianza o varianza conjunta de las variables X e Y.
x y σy son las desviaciones típicas de las variables marginales X e Y.

Escala de valores del coeficiente de correlación lineal

El coeficiente de correlación lineal de Pearson, r , indica la aproximación de los valores de la variable hacia una línea recta. Siempre toma valores comprendidos entre -1 y 1.

  • Si -1 < r < 0 existe correlación lineal negativa o inversa y será más fuerte cuanto más se aproxime r a -1.
  • si 0 < r < 1 existe correlación lineal positiva o directa y será más fuerte cuanto más se aproxime r a 1.
  • Si r = 1 ó r = -1, la correlación es una dependencia lineal directa (+1) ó inversa (-1).
  • Si r = 0 independencia, no existe correlación lineal, aunque pueden estar relacionadas por una correlación curvilínea.

Ejemplo 1:

En una empresa se seleccionan 5 trabajadores, se anotaron sus años de servicio y el tiempo de permiso en horas, solicitado el último mes. Los resultados obtenidos fueron:

X 1 3 2 4 5 4
Y 1 1 3 4 6 5

a)  Representar gráficamente los datos anteriores. Razonar si los datos muestran correlación positiva o negativa.
b)  Calcular el coeficiente de correlación e interpertarlo en términos de la situación real.

a)

Los datos muestran una correlación directa o positiva, pues cuando crece x también crece y.

b)

1 1 1 1 1
3 1 9 1 3
2 3 4 9 6
4 4 16 16 16
5 6 25 36 30
4 5 16 25 20
Total 19 20 71 88 76


Interpretación: como el coeficiente de correlación es 0,82 (que varía entre -1 y 1) podemos deducir que existe bastante relación entre una variable y otra. Y además se trata de una relación creciente, en el sentido de que al aumentar los valores de la X (número de horas de servicio) aumentan los valores de la Y (las horas de permiso).

Ejemplo 2:

En la siguiente tabla se dan las marcas femeninas de cierta reunión de atletismo:

Distancia (m) 100 200 400 800 1500
Tiempo : Minutos 0 0 0 1 3
Tiempo : Segundos 11 22 48 54 53

a) Calcular el coeficiente de correlación entre las distancias (m) y los tiempos medidos en segundos.
b) Sin efectuar cálculos, razonar si debemos esperar correlación positiva o negativa entre las variables velocidad y distancia.

a)

100 11 10000 121 1100
200 22 40000 484 4400
400 48 160000 2304 19200
800 114 640000 12996 91200
1500 233 2250000 54289 349500
Total 3000 428 3100000 70194 465400

izquierda
         arriba
derecha