************************************************
clear
all
set
seed 2145
set
obs 400
gen
nro_caso = _n
gen
vida_luego_muerte = int((runiform()*4))+ 1
label
define vida_luego_muerte 1 "sí, definitivamente" 2"si,
probablemente" 3 "probablemente no" 4 "no,
definitivamente"
label
values vida_luego_muerte vida_luego_muerte
label variable vida_luego_muerte "Hay vida después de la muerte?"
label variable vida_luego_muerte "Hay vida después de la muerte?"
gen
altura = round(rnormal(173,6))
gen
aleat = runiform()
replace
aleat = . if runiform() < 0.10
gen
gente_abusa = "todo el tiempo" if aleat < 0.10
replace
gente_abusa = "la mayoría del tiempo" if aleat >= 0.10
& aleat < 0.30
replace
gente_abusa = "pocas veces" if aleat >=0.30 & aleat
< 0.70
replace
gente_abusa = "casi nunca o nunca" if aleat >=0.70 &
aleat <= 1
label
variable gente_abusa "La gente abusa de su prójimo ….."
drop
aleat
gen
edad = int(runiform() * 40 + 18)
replace
edad = . if runiform() < 0.05
gen
religion= rbinomial(3, 0.5)
replace
religion = . if runiform() < 0.10
label
define religion 0 “hinduismo” 1 “sintoísmo” 2
“neopaganismo” 3 “budismo”
label
values religion religion
************************************************
A continuación, conteste las siguientes preguntas:
- ¿Cuántas variables hay en la base?
- ¿Cuántos casos hay?
- ¿Cuántas variables cuantitativas hay? ¿Cuáles son?
- ¿Cuántas variables categóricas hay? ¿Cuáles son?
- Las variables categóricas generalmente están almacenadas como variables numéricas con etiquetas. Sin embargo aquí una de las variables categóricas está almacenada en formato string (cadena). ¿Cuál es?
- La variable altura, ¿es normal?
- Pida la media y la desviación estándar para altura.
- Pida un resumen de 5 puntos para la variable edad.
- Grafique, con una gráfica pertinente, la variable religión. Indique cuál es la categoría más numerosa.
- Pida una nueva gráfica de la variable religión, pero ahora ordenando las barras según frecuencia de casos [catplot religion, var1opts(sort(1) descending)]
- Haga una tabla de frecuencias de la variable religion. Verifique que la categoría más numerosa es la indicada en la gráfica.
- Grafique la variable gente_abusa.
- Pida un listado de frecuencias de dicha variable.
No hay comentarios:
Publicar un comentario