domingo, 26 de febrero de 2017

Ejercicio de revisión (sin solución)

Genere una base de datos corriendo la sintaxis que sigue:




************************************************
clear all
set seed 2145
set obs 400
gen nro_caso = _n

gen vida_luego_muerte = int((runiform()*4))+ 1
label define vida_luego_muerte 1 "sí, definitivamente" 2"si, probablemente" 3 "probablemente no" 4 "no, definitivamente"
label values vida_luego_muerte vida_luego_muerte
label variable vida_luego_muerte "Hay vida después de la muerte?"

gen altura = round(rnormal(173,6))

gen aleat = runiform()
replace aleat = . if runiform() < 0.10
gen gente_abusa = "todo el tiempo" if aleat < 0.10
replace gente_abusa = "la mayoría del tiempo" if aleat >= 0.10 & aleat < 0.30
replace gente_abusa = "pocas veces" if aleat >=0.30 & aleat < 0.70
replace gente_abusa = "casi nunca o nunca" if aleat >=0.70 & aleat <= 1
label variable gente_abusa "La gente abusa de su prójimo ….."
drop aleat

gen edad = int(runiform() * 40 + 18)
replace edad = . if runiform() < 0.05

gen religion= rbinomial(3, 0.5)
replace religion = . if runiform() < 0.10
label define religion 0 “hinduismo” 1 “sintoísmo” 2 “neopaganismo” 3 “budismo”
label values religion religion

************************************************





A continuación, conteste las siguientes preguntas:

  1. ¿Cuántas variables hay en la base?
  2. ¿Cuántos casos hay?
  3. ¿Cuántas variables cuantitativas hay? ¿Cuáles son?
  4. ¿Cuántas variables categóricas hay? ¿Cuáles son?
  5. Las variables categóricas generalmente están almacenadas como variables numéricas con etiquetas. Sin embargo aquí una de las variables categóricas está almacenada en formato string (cadena). ¿Cuál es?
  6. La variable altura, ¿es normal?
  7. Pida la media y la desviación estándar para altura.
  8. Pida un resumen de 5 puntos para la variable edad.
  9. Grafique, con una gráfica pertinente, la variable religión. Indique cuál es la categoría más numerosa.
  10. Pida una nueva gráfica de la variable religión, pero ahora ordenando las barras según frecuencia de casos [catplot religion, var1opts(sort(1) descending)]
  11. Haga una tabla de frecuencias de la variable religion. Verifique que la categoría más numerosa es la indicada en la gráfica.
  12. Grafique la variable gente_abusa.
  13. Pida un listado de frecuencias de dicha variable.



No hay comentarios:

Publicar un comentario