El siguiente ejercicio pedirá la construcción e intepretación de una regresión lineal con una variable predictora cualitativa no dicotómica. Se trata de hallar el valor esperado de quienes practican cricket, fútbol, básquetbol, maratonismo y golf dada la base de datos que se genera a partir de sintaxis.
**************************************
clear
set obs 300
set seed 12589
gen deporte = trunc(runiform()*5)
label define deporte 0 "cricket" 1 "futbol" 2 "basquetbol" 3 "maratonismo" 4 "golf"
label values deporte deporte
gen puntaje_aerobico = round(rnormal(100,15)) if deporte <=2
replace puntaje_aerobico = round(rnormal(140,15)) if deporte == 3
replace puntaje_aerobico = round(rnormal(60,15)) if deporte == 4
**************************************
Ejercicio
- Pida las medias de puntaje para cada uno de los deportes.
- Corra la regresión, tomando como variable a predecir el puntaje en prueba aeróbica y como variable predictora el deporte practicado (No olvide pedirle a Stata que a partir de la variable deporte genere variables dummy).
- ¿Se puede rechazar la hipotesis nula de que conocer el deporte que practica no aporta a la predicción del puntaje aeróbico? Explique.
- ¿Cuál es la varianza explicada por el modelo?
- ¿Cuál es la ecuación de predicción del modelo?
- ¿Qué predice el modelo para quienes practican cricket, fútbol, básquetbol, maratonismo y golf?
- ¿Coinciden estas predicciones con las medias de puntaje de los distintos deportes?
- Efectúe una regresión pidiendo como categoría base el golf. ¿Cuántos puntos adicionales sobre el golf se esperan para un maratonista?
- Los datos probablemente mostrarán mayor capacidad aeróbica del maratonista. ¿Se puede concluir solo a partir de estos datos que hay aquí una relación causal en la que el maratonismo incrementa la capacidad aeróbica? Fundamente su respuesta.
No hay comentarios:
Publicar un comentario