lunes, 20 de mayo de 2019

Ejercicio de regresión lineal con variable cualitativa no dicotómica (sin solución).


El siguiente ejercicio pedirá la construcción e intepretación de una regresión lineal con una variable predictora cualitativa no dicotómica. Se trata de hallar el valor esperado de quienes practican cricket, fútbol, básquetbol, maratonismo y golf dada la base de datos que se genera a partir de sintaxis.

**************************************
clear
set obs 300
set seed 12589
gen deporte = trunc(runiform()*5)
label define deporte  0 "cricket"
1 "futbol" 2 "basquetbol" 3 "maratonismo" 4 "golf" 
label values deporte deporte
gen puntaje_aerobico = round(rnormal(100,15)) if deporte <=2
replace puntaje_aerobico = round(rnormal(140,15)) if deporte == 3
replace puntaje_aerobico = round(rnormal(60,15)) if deporte == 4
**************************************


Ejercicio


  1. Pida las medias de puntaje para cada uno de los deportes.
  2. Corra la regresión, tomando como variable a predecir el puntaje en prueba aeróbica y como variable predictora el deporte practicado (No olvide pedirle a Stata que a partir de la variable  deporte genere variables dummy).
  3. ¿Se puede rechazar la hipotesis nula de que conocer el deporte que practica no aporta a la predicción del puntaje aeróbico? Explique.
  4. ¿Cuál es la varianza explicada por el modelo?
  5. ¿Cuál es la ecuación de predicción del modelo?
  6. ¿Qué predice el modelo para quienes practican cricket, fútbol, básquetbol, maratonismo y golf?
  7. ¿Coinciden estas predicciones con las medias de puntaje de los distintos deportes?
  8. Efectúe una regresión pidiendo como categoría base el golf. ¿Cuántos puntos adicionales sobre el golf se esperan para un maratonista?
  9. Los datos probablemente mostrarán mayor capacidad aeróbica del maratonista. ¿Se puede concluir solo a partir de estos datos que hay aquí una relación causal en la que el maratonismo incrementa la capacidad aeróbica? Fundamente su respuesta.


No hay comentarios:

Publicar un comentario