lunes, 29 de febrero de 2016

Cómo medir la fuerza de la asociación en tablas cruzadas de 2 x 2 y mayores. Texto.




James Rosenthal es un viejo autor a quien vale la pena leer. Yo diría que es un clásico.

Lo que sigue se apoya fundamentalmente en Rosenthal, pero también algo en otros autores. Lo dicho vale esencialmente para las ciencias sociales, y no para otras ciencias en donde se podrán encontrar habitualmente fuerzas de asociación mayores o menores.

¿Cómo informar la fuerza de la asociación en una tabla de 2 x 2?



Diferencia de porcentajes.




En la tabla de 2 * 2 de arriba los porcentajes están calculados horizontalmente. Los porcentajes en la tabla están todos entre 10% y 90%. En estas condiciones encuentra razonable usar la diferencia de porcentajes, e informar por ejemplo así: Entre los no pobres, hay un 30% más de personas que completaron liceo (55% - 25%).

Es un tema algo espinoso catalogar de diferencias de grandes, medianas o pequeñas: hasta cierto punto depende de las disciplinas lo que es grande y lo que es chico. Y dentro de las disciplinas del área específica que se está estudiando.

De todas maneras, a modo de orientación, Rosenthal maneja estas cifras:


Cociente de porcentajes

Si en la tabla de 2 * 2 una de las cantidades está por debajo de 10%, se inclina por el cociente de porcentajes (RR por risk ratio, o también riesgo relativo, como se lo conoce en medicina).


Si no lo hiciera así, la diferencia de arriba debería llamarla chica. Pero el efecto es grande: el que no se vacuna tiene 9 veces más riesgo de enfermarse.

En definitiva, si una de las cifras es menor al 10 %, se inclina por el cociente de porcentajes o RR (riesgo relativo).

RR varía de 0 a infinito.

Nótese que si el riesgo de enfermarse es 9 veces mayor entre quienes no se vacunaron con respecto a quienes sí se vacunaron, el riesgo de enfermarse es 1/9 entre quienes se vacunaron con respecto a quienes no se vacunaron.

Según cómo se haga la cuenta, RR es 9.0 o 1/9. Es la misma fuerza de asociación, expresada de dos formas distintas. Dicho de otra manera, esas fuerzas de asociación expresan lo mismo, pero se toman distintas categorías de referencia.

¿A qué llamaba Rosenthal fuerza de asociación pequeña, grande, etc.? Veáse.





Odds Ratio


Rosenthal apreciaba mucho la medida OR para las tablas de 2 * 2. Es bueno comprender esta medida: se usa también obligatoriamente en regresión logística y en estudios de caso - control. Ahora bien, muchos no gustan de ella porque no es tan intuitiva como el RR.

Odds Ratio es un ratio, un cociente, de odds.

Y las odds son una forma de expresar la probabilidad. Si tiramos un dado, la posibilidad de que salga un 4 es de 1 en 6. Probabilidad = 1/6. Esta probabilidad se puede expresar como odds, que es el cociente entre la probilidad de que suceda un evento dividida la probabilidad de que no. Entonces el odd de que salga un 4 es de 1 contra 5. Odd = 1/5.

El OR es un ratio de odds.

Veámoslo ejemplificado en la tabla que sigue:



Acá las probabilidades de haber votado por el gobierno, entre quienes apoyan la ley, son de 30%. En cambiom expresado en odds, tenemos que son de 30/70.

Y las odds de haber votado por el gobierno entre quienes rechazan la ley son de 8/92.

Por eso  OR (odds ratio) = (30 / 70) / (8 / 92), y esto es igual al producto cruzado. OR = (30 * 92) / (70 * 8) = 4.93. Rosenthal lo consideraría fuerte en el contexto de las ciencias sociales.


OR varía de 0 a infinito. No hay asociación si OR es 1.

Cuando se habla de OR tiene que quedar claro cuál es el evento del que hablamos (aquí haber votado por el gobierno) y cuál el grupo de referencia (aquí rechazar la ley). Entonces podríamos decir que las odds de haber votado por el gobierno son 4.93 mayores en el grupo que apoya la ley que en el grupo de la rechaza.

Si se cambia el grupo de referencia, el OR pasa a ser el recíproco. Por ejemplo, el OR de 4.93 se transformaría en un OR = (1/4.93) = 0.203. Por ello un OR de 4.93 y un OR de 0.203 indican la misma fuerza de asociación.

Valen los mismos valores para lo que es una asociación débil, mediana, etc.





Tablas mayores a 2 * 2

Sigue una tabla de 3 * 2 con variables nominales. Para estas tablas Rosenthal plantea que una buena medida de asociación es la V de Cramer. La V de Cramer varía de 0 (no asociación) a 1 (asociación perfecta). Da una medida global del grado de asociación.

Ahora bien, más allá de establecer una medida del grado global de asociación, importa ver en qué celdas hay excesos o déficits marcados. En estas tablas es absolutamente imprescindible el análisis celda a celda, esto es, ver en qué celdas hay excesos relativos o carencia relativa de casos.






Para Rosenthal, el uso primario de la V de Cramer son tablas mayores a las de 2 * 2, pero pueden ser usadas en estas últimas.

(En las tablas de 2 x 2 hay otros autores que miran con desconfianza el uso de la V de Cramer si alguna de las distribuciones es muy desbalanceada, es decir si una de las categorías tiene menos del 10 % de los casos).


No disponiendo de datos de Rosenthal sobre cómo interpretar la V de Cramer, adjunto criterio de Rea y Parker.


Tablas con variables ordinales

La preferencia de Rosenthal es por tau B si la tabla es cuadrada, es decir si tiene igual número de filas y categorías.

Y si el número de categorías es distinto entre las variables, su preferencia es Tau C (1).

Es de hacer notar que tau b y tau c tratan de ver si existen relaciones crecientes o decrecientes, pero no sirven para medir la fuerza de una relación curvilínea.


En ciencias sociales, se pueden usar estos criterios para llamar débil, moderado o fuerte a un tau:

tau de aproximadamente 0.10 ........ débil
tau de aproximadamente 0.30..........moderado
tau de aproximadamente 0.50 .........fuerte.


Estos valores deben tomarse solamente como orientativos, y pueden haber áreas dentro de las disciplinas que usen distintos criterios.



(1) Tomado de James Rosenthal "Statistics and Data Interpretation for Social Work".
















No hay comentarios: