calculo.cc

Coeficiente de determinación

El coeficiente de correlación lineal indica el grado de linealidad entre las dos variables, pero para analizar la bondad del ajuste de la recta de regresión se utiliza un parámetro llamado coeficiente de determinación.

Se llama coeficiente de determinación al cuadrado del coeficiente de correlación lineal.


Ejemplo 1:

El coeficiente de determinación de una distribución cuya nube de puntos se ajusta a una recta es igual a 0,85. Interpreta este resultado:

Si  r2= 0,85  significa que el 85% de la variación de Y puede ser debido a la varación de X si se usa la regresión lineal. El 15% restante de la variación de Y puede deberse al azar o a la influencia sobre Y de otras variables distintas de X.

Ejemplo 2:

El coeficiente de determinación de una distribución cuya nube de puntos se ajusta a una recta es igual a 0,33.
a) Interpreta este resultado.
b) ¿Tiene sentido encontrar un modelo lineal para esta distribución que permita realizar estimaciones?


a) Si r 2 = 0,33 signifa que el 33% de las variación de Y se debe a la variación de X si usamos regresión lineal. Mientras que el 67% restante de la variación de Y se debe al azar o a la influencia sobre Y de otras variables distintas de X.

b) Que el coeficiente de relación sea r 2 = 0,33 implica que el coeficiente de correlación es r = ± 0,57 , lo que nos indica que se trata de una dependencia aleatoria media-baja. Por tanto le modelo lineal tan sólo tendrá sentido cuando realicemos estimaciones en puntos muy cercanos a

Ejemplo 3:

Si el coeficiente de correlación vale r = 0,7.
a) ¿Qué tanto por ciento de la variación de Y es debido a la variación de X usando el modelo de regresión lineal?
b) ¿Tiene sentido realizar estimaciones en la recta de regresión obtenida?

a) El coeficiente de determinación será r 2 = 0,72 = 0,49 , lo que nos indica que un 49% de la variación de Y es debida a la variación de X.

b) En este ejemplo, el coeficiente de correlación vale 0,7 lo que nos indica que esta distribución presenta una dependencia intermedia-fuerte, y las estimaciones que realicemos con la recta de regresión sólo tendrán sentido si se hacen para puntos cercanos al centro de gravedad de la distribución :

Ejemplo 4:

Se midieron los valores de concentración en microgramos por centímetro cúbico de una sustancia A en un suero fetal y los valores de su concentración en suero materno. Se obtuvieron los siguientes datos en una muestra de seis embarazadas al final de la gestación:

Concentración suero madre (X) 8 4 12 2 7 9
Concentración suero feto (Y) 6 4 8 1 4 5

a) Calcula el coeficiente de correlación lineal.
b) Halla la recta que permita estimar los valores fetales a partir de los maternos.
c) Halla el coeficiente de determinación e interprétalo para estudiar la bondad del ajuste.

a)

8 6 64 36 48
4 4 16 16 16
12 8 144 64 96
2 1 4 1 2
7 4 49 16 28
9 5 81 25 45
Sumas: 42 28 358 158 235

c) El coeficiente de determinación es r 2 = 0,865. Es decir que el 86,5% de la variación de Y se puede explicar mediante la variación de X si utilizamos la recta de regresión. Mientras que el 13,5% restante de la variación de Y no se explica con la recta de regresión, luego el ajuste lineal es bueno.

izquierda
         arriba
derecha