domingo, 30 de junio de 2019

Regresion lineal múltiple. Segundo ejemplo. Video


En este video analizaremos una base real, que tiene datos sobre 400 establecimientos escolares de California del año 2000, base que tomo de esta página


Las variables que nos interesarán son:


api00           Academic Performance Index (Indice de Performance Academíca año                    2000)

meals           pct free meals (% de comidas gratis: indicador indirecto de                        pobreza)

ell             english language learners (Indicador de niños inmigrantes)

yr_rnd          year round school (Escuela que funciona todo el año. La carga                      horaria es la misma: las clases se espacían más)

mobility        pct 1st year in school (Porcentaje de alumnos nuevos en la escuela)

acs_k3          avg class size k-3 (Tamaño promedio de clases en preescolares)

acs_46          avg class size 4-6 (Tamaño promedio clases en la escuela)

full            pct full credential (% de docentes con credenciales plenas)

emer            pct emer credential (% de docentes con credenciales de emergencia)

enroll          number of students (Número de estudiantes en la escuela)



Base

Video

jueves, 20 de junio de 2019

Regresión lineal múltiple. Primer ejemplo. Video


A partir de la constitución de una base con la sintaxis adjunta, se arma modelo para predecir el colesterol a partir de las variables sexo, calorías de la dieta, porcentaje de grasa de la dieta, y minutos de TV -este último como indicador de sedentarismo-.


****************
clear all
set obs 500
set seed 1320
gen minutos_TV = round(rnormal(300,50))
gen pct_grasasDieta = rnormal(30,8)
gen calorias_dieta = round(rnormal(1600,100) + pct_grasasDieta * 10 + rnormal(0, 300))
gen sexo = rbinomial(1,0.4)
label define sexo 0 "Hombre" 1 "Mujer"
label values sexo sexo

gen colesterol = minutos_TV * 0.05 + pct_grasasDieta + 0.02 * calorias_dieta + rnormal(0,17) - 15*sexo
****************


Video

viernes, 14 de junio de 2019

Homocedasticidad, heterocedasticidad, estat hettest y opción robust. Video.

 En este video se verá el concepto de homocedasticidad y su opuesto, el de heterocedasticidad.

Uno de los supuestos del método de regresión lineal es la homocedasticidad. En este video se explica como explorarla gráficamente en las regresiones con una sola variable predictora, se ve un test de significación para la homocedasticidad (estat hettest), y una forma de contrarrestar las dificultades que presenta la heterocedasticidad: usar el comando regress con la opción robust.


do file

Video

lunes, 10 de junio de 2019

Regresión lineal: relaciones curvilíneas. Video

Antes de hacer una regresión hay que graficar.

Hay que graficar para detectar outliers, si los hay.

Hay que graficar para detectar relaciones curvilíneas si las hay.

En el video que sigue, se utilizará la base que surge de correr la sintaxis siguiente.



********************************
clear all
set obs 100
set seed 568995
gen ansiedad = runiform() * 9 + 1
replace ansiedad = round(ansiedad, 0.2)
gen puntaje_examen = 30 + 20 * ansiedad -1.5 * ansiedad^2 + rnormal(0,5)
********************************



Video