sábado, 20 de julio de 2019

Regresión lineal. Modelos polinómicos. Video



En ocasiones tenemos relaciones curvilíneas entre variables. Aún así, la técnica de regresión lineal puede con frecuencia funcionar eficazmente.

Las relaciones curvilíneas muchas veces pueden ser ajustadas introduciendo como variables predictoras adicionales la variable elevada al cuadrado y/o al cubo.


Terminos cuadráticos 

Un término cuadrático es simplemente una variable elevada al cuadrado.


Por ejemplo, véase la siguiente relación entre x e y.






Se grafica abajo, en color rojo, la predicción lineal hallada usando como variables predictoras X y su cuadrado.




 Cuando la curva ajusta bien, se da que 1) aumenta el R^2 ajustado y 2) la variable X^2 se muestra significativa. Además, la verificación de los residuos del modelo nos dirá que estos se distribuyen normalmente y en forma heterocedástica, como se verá más adelante.


Si no ajustara bien, podrán buscarse otros modelos para ajustar dicha curvatura.


En las regresiones no conviene generar una nueva variable con el cuadrado. Para tener el término cuadrado de una variable continua var1, nos conviene pedirlo así: var1#var1. La razón es que los comandos margins y marginsplot exigen esta nomenclatura para funcionar adecuadamente. Todo esto se verá más adelante.



***


Los modelos polinómicos no solo pueden tener términos al cuadrado, también los pueden tener cúbicos, elevados a la cuarta potencia, etc.


Términos cúbicos

 La gráfica que sigue muestra una doble inflexión, primero hacia abajo y luego hacia arriba. 





Estas curvas pueden ser modeladas, a veces, con un término al cuadrado y otro cúbico. O sea, los predictores fueron X, X^2 y X^3. Abajo se muestra el ajuste del modelo. Los valores predichos están graficados en rojo, y como puede verse, reflejan muy bien la relación entre las variables. Los términos cúbicos de variables continuas también conviene pedirlos usando notación factorial. Así var1 al cubo se representará en el comando regress con c.var1#c.var1#c.var1. La c indica que la variable es continua y el símbolo de numeral funciona aquí como si fuera un símbolo de multiplicación.





 ¿Puede un modelo lineal predecir una relación curvilínea? ¿Es lineal un modelo que tiene variables elevadas al cuadrado y al cubo? Sí, es lineal. Veamos la definición matemática de un modelo lineal.


Dice Jim Frost:

“linear models must follow one very particular form:

Dependent variable = constant + parameter * IV + … + parameter * IV
The form is linear in the parameters because all terms are either the constant or a parameter multiplied by an independent variable (IV). A linear regression equation simply sums the terms. While the model must be linear in the parameters, you can raise an independent variable by an exponent to fit a curve. For instance, you can include a squared or cubed term.”



Y si una ecuación no tiene este formato no es lineal.
Por ejemplo, si X figura como exponente en la ecuación (b^x), si hay cosenos de X, etc. Las ecuaciones no lineales son más difíciles de interpretar. Si se puede modelar bien una ecuación mediante modelos lineales es mejor: se interpretan más fácilmente. Para usar modelos no lineales, probablemente el mejor camino sea consultar a estadísticos.


Video













No hay comentarios:

Publicar un comentario