Ejecute la sintaxis que sigue, la cual creará una base de datos:
************************************************
clear all
set seed 2145
set obs 400
gen nro_caso = _n
gen colorpelo = int((runiform()*4))+ 1
label define colorpelo 1 "rubio"
2"pelirrojo" 3 "castaño" 4 "negro"
label values colorpelo colorpelo
label variable colorpelo "Color de pelo"
label variable colorpelo "Color de pelo"
gen altura = round(rnormal(173,6))
gen aleat = runiform()
gen nov_pref = "policial" if
aleat < 0.10
replace nov_pref = "ciencia
ficcion" if aleat >= 0.10 & aleat < 0.40
replace nov_pref = "romantica"
if aleat >=0.40 & aleat < 0.70
replace nov_pref = "historica"
if aleat >=0.70 & aleat <= 1
label variable nov_pref "Tipo de
novela preferida"
drop aleat
gen sueldo = int(rnormal(200, 15))
gen patrimonio = rnormal(45000, 8200)
************************************************
A continuación, conteste las siguientes preguntas:
- ¿Cuántas variables hay en la base?
- ¿Cuántos casos hay?
- ¿Cuántas variables cuantitativas hay? ¿Cuáles son?
- ¿Cuántas variables categóricas hay? ¿Cuáles son?
- Las variables categóricas generalmente están almacenadas como variables numéricas con etiquetas. Sin embargo aquí una de las variables categóricas está almacenada en formato string (cadena). ¿Cuál es?
- La variable patrimonio, ¿es normal?
- La variable sueldo, ¿es normal?
- Pida las medidas de resumen para las variables patrimonio y sueldo que estime pertinentes. (Se recuerda que las medidas de resumen para variables cuantitativas más habituales son, o bien media y desviación estándar o bien resumen de 5 puntos).
- Grafique, con una gráfica pertinente, la variable colorpelo. Indique cuál es la categoría más numerosa.
- Haga una tabla de frecuencias de la variable colorpelo. Indique cuál es la categoría más numerosa.
Video con solución
No hay comentarios:
Publicar un comentario