viernes, 5 de julio de 2019

Ejercicio de regresión lineal con variable categórica (sin solución)


Genérese una base corriendo la sintaxis que sigue:

****************
clear all
set obs 300
set seed 1234
gen tema = trunc(runiform()*3) + 1
label define tema 1 "policial" 2 "comedia" 3 "politica"
label values tema tema
gen presupuesto = round(rnormal(4000, 800))

label variable presupuesto "presupuesto en miles de dólares"
gen taquilla = presupuesto * 2 + (tema==3) * 0.8 + (tema==2) * 800 + rnormal(0, 1600)

label variable taquilla "Taquilla en millones de dólares" 
cls

****************

La base simula datos sobre películas: sobre su presupuesto, tema y taquilla.

Un investigador desea predecir la taquilla en base a su presupuesto y tema.

1) De un primer análisis gráfico, ¿se justifica hacer un modelo de predicción lineal con estas variables?

2) Dado ese primer análisis gráfico, ¿qué conclusiones espera?

2)  Efectúe la regresión lineal. ¿Cuál es la ecuación de predicción?

3) ¿Ambas variables son significativas?

4) Las diferencias entre temas (policial, comedia y política), ¿son todas significativas? Explique.

No hay comentarios:

Publicar un comentario