miércoles, 30 de octubre de 2019

Problema de interacción de dos variables continuas (sin solución)


El siguiente ejemplo está inspirado en uno del estupendo libro de Jim Frost Regression Analysis




Imaginemos que deseemos maximizar la resistencia (strength) de una aleación, y que tenemos razones teóricas para creer que depende de la temperatura (temperature), la presión (pressure) y el tiempo (time) en el horno.

Se piensa también, a partir de consideraciones teóricas, que existe interacción entre temperatura, presión y resistencia.

Se pide:


1) Establezca la ecuación de regresión para la variable dependiente resistencia (strength), con las variables independientes temperatura, presión, tiempo, y la interacción entre temperatura y presión.


2) Grafique la relación entre resistencia y temperatura con ayuda de los comandos margins y marginsplot, para distintos puntos de presión.
[margins, at (temperature=( 95 (5) 110)  pressure= (70 (5) 80))
marginsplot]

(Nota: para graficar un caso de interacción de dos variables continuas, se emplea un solo at. Se abre paréntesis y allí se ponen las dos variables, seguidos de signos "=" y de los valores que se desean graficar).


3) Interprete.


4) Grafique la relación entre resistencia y presión, para distintos puntos de temperatura, con ayuda de los comandos margins y marginsplot. [margins, at ( pressure= (70 (5) 80)  temperature=( 95 (5) 110) )]


5) Interprete.




Base de datos

viernes, 25 de octubre de 2019

Regresión lineal. Margins y marginsplot. Texto


Los comandos margins y marginsplot son sumamente útiles cuando estamos en presencia de interacciones y de relaciones curvilíneas.

En el documento se muestran las sintaxis a utilizar y los resultados que producen.


domingo, 20 de octubre de 2019

Interaccion. Dos variables cuantitativas y una categórica. Video

En este ejemplo se analiza la relación entre palabras aprendidas de un idioma extranjero y tiempo de estudio. Luego se introduce la variable Piensa Viajar.

Parece razonable pensar que las palabras aprendidas de un idioma extranjero por hora dependen de si piensa viajar o no. Si piensa viajar aumenta la motivación, y es probable que en cada hora se aprendan más palabras.

La de arriba es una hipótesis de interacción: el efecto de las horas de estudio sobre las palabras aprendidas depende de si piensa viajar o no.

La interacción se representará en la regresión por el producto de las variables en interacción. Aquí se introduce el producto de las variables piensa viajar por horas de estudio.

Cuando hay interacciones se usa una nomenclatura especial:
las palabras categóricas llevan delante una i. Ejemplo: i.piensa_viajar

Las continuas llevan una c. Ejemplo: c.horas_estudio

Y el término de interacción se escribe:
i.piensa_viajar#c.horas_estudio

La base a utilizar surge de la siguiente sintaxis:



*******************************************************************
clear
set seed 2027
set obs 5000
gen piensa_viajar = rbinomial(1, 0.55)
gen horas_estudio = round(rnormal(250, 70))
gen palabras_aprendidas = round(300 + 2 * horas_estudio + rnormal(0,200)) if piensa_viajar == 0
replace palabras_aprendidas = round(500 + 16 * horas_estudio + rnormal(0,200)) if piensa_viajar == 1
*******************************************************************

Video

jueves, 10 de octubre de 2019

Interacción. Dos variables cualitativas y una continua. Video.

La sintaxis adjunta genera una base que simula datos sobre personal administrativo que no habla idiomas, que habla inglés o chino, o que habla ambos idiomas.

Se trata de conocer la importancia que tiene sobre el salario hora, el conocimiento de dichos idiomas por separado y conjuntamente.

Se mostrará una interacción: el efecto de dos características (aquí hablar chino y hablar inglés) es distinto de la suma de ambos efectos! En este caso es una sinergia: saber ambos idiomas redunda más que la suma de cada uno por separado.


************************************************
clear all
set obs 600
set seed 1534
gen habla_chino = rbinomial(1,0.35)

label define habla_chino 0 "No habla chino" 1 "Habla chino"
label values habla_chino habla_chino
gen habla_ingles = rbinomial(1,0.55)

label define habla_ingles 0 "No habla inglés" 1 "Habla inglés"
label values habla_ingles habla_ingles
gen salario_hora = rnormal(500, 15)
replace salario_hora = salario_hora + 100 if habla_chino == 1
replace salario_hora = salario_hora + 150 if habla_ingles == 1
replace salario_hora = salario_hora + 400 if habla_ingles==1 & habla_chino== 1
************************************************


Video