jueves, 20 de abril de 2017

Ejercicio de comparación de medias (o medianas) con Anova, Kruskal Wallis y prueba de la mediana (sin solución)

Ejecútese la sintaxis que sigue y se dispondrá de una base de datos para realizar el ejercicio.


************************************************
clear all
set obs 200
set seed 1234
gen dieta = trunc(runiform()*3)
label define dieta 0 "Bajas calorías" 1 "Bajos carbohidratos" 2 "Bajas grasas"
label values dieta dieta
replace dieta = 1 if dieta == 2 & runiform() < 0.5
gen perdida_peso = rnormal(7,2) if dieta == 0
replace perdida_peso = rnormal(15, 5) if dieta == 1
replace perdida_peso= rnormal(8,1) if dieta == 2
gen colesterol = rnormal(180, 4)
gen edad = round(rnormal (50, 4))
replace edad = edad + 6 if dieta == 1
*************************************************

En esta base hay cuatro variables:

  • Dieta (de bajas calorías, de bajos carbohidratos y de bajas grasas)
  • Pérdida de peso
  • Colesterol
  • Edad



Se asume que tres grupos de personas fueron sujetos a diferentes dietas durante algún tiempo, y que al fin del período se miden la pérdida de peso y el nivel de colesterol. Asimismo se registró la edad de los participantes.

Se pide al estudiante:


Colesterol:


  1. Grafique la relación entre colesterol y dieta. ¿Las gráficas muestran una distribución razonablemente simétrica, que sugiera normalidad? ¿Las varianzas son aparentemente iguales? ¿Las medias tienen grandes diferencias?
  2. Ejecute una prueba de Anova. ¿Qué dice el test de Bartlett sobre las varianzas: que son estadísticamente significativas o no? 
  3. Si las diferencias entre las varianzas no son estadísticamente significativas interprete Anova. ¿Hay diferencias significativas entre las medias?
  4. Si hay diferencias significativas entre las medias, indique entre qué dietas mediante una prueba post-hoc



Edad


  1. Grafique la relación entre edad y dieta. ¿Las gráficas muestran una distribución más o menos simétrica, que sugiera normalidad? ¿Las varianzas son aproximadamente iguales? ¿Las medias parecen tener diferencias importantes?
  2. Efectúe la prueba de Anova. ¿Qué dice el test de Bartlett sobre las varianzas: que son estadísticamente significativas o no?
  3. Si las diferencias entre las varianzas no son estadísticamente significativas interprete Anova. ¿Hay diferencias significativas entre las medias?
  4. Si hay diferencias significativas entre las medias, efectúe análisis post-hoc, para ver entre qué medias hay diferencias.




Pérdida de peso


  1. Grafique la relación entre pérdida de peso y dieta. ¿Las gráficas muestran una distribución más o menos simétrica que sugiera normalidad? ¿Las varianzas son aproximadamente iguales? ¿Las medias tienen grandes diferencias?
  2. Aún si hay fuertes diferencias entre las varianzas, ejecute Anova, simplemente para ver si el resultado del test de Bartlett. ¿Indica que las diferencias entre las varianzas es estadísticamente significativa?
  3. Si las diferencias entre las varianzas se muestran estadísticamente significativas, abandone el test de Anova y efectúe dos pruebas no paramétricas: la de Kruskall Wallis y la prueba de la mediana.
  4. Indique qué conclusiones saca de estas pruebas no paramétricas y si coincide con lo que esperaba a partir de la gráfica para ver la relación entre estas variables (pérdida de peso y dieta).







No hay comentarios:

Publicar un comentario