martes, 10 de diciembre de 2019

Problema de regresión múltiple (sin solución)


El problema que se presentará consiste en responder a la pregunta: ¿son más altos los puntajes SAT en estados de EEUU que gastan más dinero en educación después de controlar por otros factores?


Se usará la base que sigue:

states.dta 


Se trabajará con las siguientes variables:

csat (puntajes en pruebas SAT)
expense (gastos por alumno)
percent (% de estudiantes egresados que toman la prueba SAT)
income (ingreso medio de los hogares)
high (% de adultos que terminaron high school)
college (% de adultos con universidad)
region (región)


La página de la cual se extrajo el ejemplo es https://www.princeton.edu/~otorres/Regression101.pdf

Se pide:

  1. Estudie gráficamente la relación de las variables predictoras con la variable csat y comente.
  2. Haga un modelo de regresión múltiple con las variables predictoras de arriba.
  3. Grabe este primer modelo
  4. Elimine de a una las variables no significativas, si las hubiera.
  5. Grabe los sucesivos modelos
  6. Preséntelos en una tabla comparativa y seleccione fundadamente el que a su juicio es el mejor.
  7. Indique la ecuación de regresión de dicho modelo.
  8. Indique qué variables muestran mayor capacidad predictora.
  9. Corra los test diagnósticos usuales para evaluar la adecuación del modelo, y comente los resultados.









No hay comentarios:

Publicar un comentario