martes, 25 de abril de 2017

Relaciones bivariadas entre dos variables categóricas no ordenadas. Tab2 y spineplot. Video


Probablemente la herramienta más útil para estudiar relaciones entre dos variables categóricas no ordenadas sea la tabla de porcentajes.

Imaginemos que en una encuesta deseamos estudiar la relación entre sexo y afiliación a sindicato, y que pensemos que el sexo puede influir en la decisión de afiliarse. Realizaríamos esta tabla.





En la tabla anterior nos encontraríamos que no hay asociación entre estas variables: ser hombre o ser mujer no torna más probable estar afiliado. Esta es una NO ASOCIACION perfecta. No hay nada de asociación.


*

Imaginemos ahora que queremos estudiar la relación entre sexo y gusto por el boxeo, y que una encuesta arrojase los siguientes resultados.







En esta tabla la ASOCIACION es perfecta, porque la diferencia entre quienes gustan del boxeo es máxima entre sexos: gusta al 100% de los hombres y al 0% de las mujeres.

Usualmente se ven situaciones intermedias.

Ambas tablas tienen la variable dependiente (sexo) en las columnas y se pide el porcentaje por columnas. Luego se comparan los porcentajes a través.


Si hay relación en una muestra y queremos saber si podemos descartar la hipótesis nula de no asociación en el universo, tenemos dos pruebas de significación: chi cuadrado y test exacto de Fisher. La prueba de chi cuadrado requiere que menos del 20% de las celdas tengan cinco casos o menos. Si no se diera esto, recurrimos al test exacto de Fisher.

Una buena manera de graficar la relación entre dos variables categóricas es con el llamado diagrama de mosaico. Podemos efectuarlos con ayuda del programa de usuario spineplot.

La fuerza de la asociación se puede medir con la V de Cramer, en donde 0 significa no asociación, y +1 y -1 significan asociaciones perfectas (según la diagonal que concentre los casos será +1 o -1).

Se mostrará como ejecutar estos análisis en el video que sigue.


Video



No hay comentarios:

Publicar un comentario