El problema que se presentará consiste en responder a la pregunta: ¿son más altos los puntajes SAT en estados de EEUU que gastan más dinero en educación después de controlar por otros factores?
Se usará la base que sigue:
states.dta
Se trabajará con las siguientes variables:
csat (puntajes en pruebas SAT)
expense (gastos por alumno)
percent (% de estudiantes egresados que toman la prueba SAT)
income (ingreso medio de los hogares)
high (% de adultos que terminaron high school)
college (% de adultos con universidad)
region (región)
La página de la cual se extrajo el ejemplo es https://www.princeton.edu/~otorres/Regression101.pdf
Se pide:
- Estudie gráficamente la relación de las variables predictoras con la variable csat y comente.
- Haga un modelo de regresión múltiple con las variables predictoras de arriba.
- Grabe este primer modelo
- Elimine de a una las variables no significativas, si las hubiera.
- Grabe los sucesivos modelos
- Preséntelos en una tabla comparativa y seleccione fundadamente el que a su juicio es el mejor.
- Indique la ecuación de regresión de dicho modelo.
- Indique qué variables muestran mayor capacidad predictora.
- Corra los test diagnósticos usuales para evaluar la adecuación del modelo, y comente los resultados.
No hay comentarios:
Publicar un comentario