domingo, 27 de diciembre de 2015

Variables ordinales: significación y fuerza de la asociación. Video

Se presentan varias medidas de asociación para relaciones entre variables ordinales:

  • Gamma
  • d de Somers
  • tau - b
  • tau -c
  • r de Spearman

No hay unanimidades respecto a cuáles medidas son preferibles en distintas circunstancias.

Algunos usan, cuando hay muchos empates en los valores de las variables, alguno o varios de los siguientes coeficientes: Gamma, d de Somers, tau-b o tau-c. Hay muchos empates si, por ejemplo, una variable ordinal solo toma tres valores: alto, medio y bajo. Entonces habrá muchos casos empatados en cada categoría.

Hay otras ocasiones en que la variable ordinal toma muchos valores distintos. Por ejemplo la posición en un concurso. Si hay 200 concursantes, podría haber hasta 200 valores distintos, o alguno menos si hubiera empates en alguna posición. Por ejemplo, los concursantes 3 y el 4 podrían empatar, y se les daría el puntaje 3.5 a cada uno. Pero de todas formas, habría muchos valores distintos.

Para ver la relación entre dos variables con estas características, muchos estadísticos prefieren r de Spearman (también se habla de rho de Spearman).


https://drive.google.com/open?id=1scqDFDenwOThTBRGq2FwU01OLwLWEhFT

sábado, 26 de diciembre de 2015

Variables nominales: significación y fuerza de asociación. Video.

Este post adjunta una base de datos y un vídeo, que deberán ser descargados a la computadora del lector para poder trabajar con ellos.

El tema tratado es el de la relación de variables nominales. Se muestra cómo entender una tabla de porcentajes, cómo llevar adelante pruebas de significación (chi cuadrado y test exacto de Fisher), y cómo medir la fuerza de la asociación (V de Cramer, Phi y OR).

El vídeo y la base están disponibles en
https://drive.google.com/open?id=0B9C7VyfotFyJb2FQOXBRMjl3VlU

viernes, 25 de diciembre de 2015

Concordancia entre medidas continuas: Método gráfico de Bland y Altman. Texto y video.

Sean dos medidas continuas x e y. Podrían ser dos determinaciones de un cierto parámetro en sangre halladas por dos marcas de reactivos distintas.

El método de Bland Altman está pensado para evaluar la concordancia (o falta de concordancia) entre dos mediciones.


Exploración preliminar

Antes de hacer la gráfica típica de Bland y Altman, exploremos someramente los datos. Grafiquemos la medida X contra la medida Y y dibujemos la linea de igualdad (a 45 grados, y pasa por el punto (0,0). En esta línea deberían caer todos los puntos si las dos medidas fueran exactamente iguales. Esto ayuda a que el ojo calibre el grado de acuerdo entre las medidas, aunque luego la gráfica de Bland y Altman nos ofrecerá una alternativa que nos permitirá ver con más precisión.




En el gráfico de arriba se ve que la nube de puntos está un poco por arriba de la línea de igualdad entre X e Y. Eso es porque los valores de Y son un poco mayores que los valores de X.

También se ve que Y siempre es mayor que X, y que la diferencia es similar en los valores bajos y en los valores altos de X. Dicho con otras palabras, la nube es paralela a la recta de igualdad y tiene igual varianza aproximcada a lo largo del recorrido.

***


Para hacer la gráfica típica del método de Bland y Altman debemos calcular dos medidas derivadas de X e Y:

a) el promedio: (x + y) /2
b) la diferencia (x-y)

y luego graficarlas. El promedio va en el eje X y las diferencias en el Y.

Para las diferencias se hallarán la media y las desviaciones estándar. Se trazarán dos líneas paralelas alrededor de la media a +/- 2 desviaciones estándar, que contendrán el 95 % de las diferencias.

Veamos primero la gráfica del promedio X-Y versus diferencias X - Y.


Las diferencias X - Y tienden a ser negativas, como puede verse. Se piden ahora su media y su desviación estándar.








Ahora trazamos una línea por la media de las diferencias. Divide, en tanto la nube de puntos sea básicamente horizontal, la nube de puntos en dos. Nótese que en términos generales la nube de puntos acompaña la media de las diferencias, o, en otras palabras, que la nube de puntos no está claramente inclinada. 

Si la nube de puntos estuviera claramente inclinada, la diferencia media entre X e Y variaría con el valor del promedio de X e Y. Si esto sucediera se hablaría de bias proporcional, pero aquí no está presente.

Luego trazamos dos líneas horizontales con los valores Media +/- 2 desviaciones estándar. Dentro de la media más/menos 2 desviaciones estándar caerán el 95 % de las observaciones.

Ahora solo resta evaluar las diferencias.




Digamos entonces que la diferencia media entre métodos es de 3.04 puntos, y que Y es mayor que X.

Digamos además que las diferencias entre uno y otro método van a estar en el 95% de los casos entre +1.29 (media + 2 DS) y -7.37 (media - 2 DS).

Se llaman límites de concordancia entre X y Y a los valores +1.29 y -7.37.

Llamaremos bias de un método respecto al otro a la media de las diferencias. Aquí el bias o sesgo de Y con respecto a X es de 3.04.

¿Qué tan relevantes son estas diferencias? Hay áreas donde son pueden ser tolerables y áreas donde no. Corresponderá evaluar la importancia según el caso.

No es la misma la precisión necesaria en el motor de un avión que en el ancho de las paredes de una vivienda.

Nota: este es un caso simple donde se muestra Bland y Altman. El método puede requerir ajustes si, por ejemplo, las diferencias fueran mucho más restringidas para valores bajos del promedio X-Y y más amplias para valores altos del promedio X-Y.


Se adjunta

base y video propio

Artículo  de profundización de Bland y Altman


Video de Todd Grande:



domingo, 20 de diciembre de 2015

ICC: Coeficiente de correlación intraclase. Texto e hipervínculos a videos ajenos.

Se usa para ver en qué medida concuerdan dos o más varias medidas cuantitativas.

Para correr un análisis de correlación intraclase hay que elegir un modelo y un tipo.



******


Hay que elegir un modelo: 


Dos factores, efectos mixtos Si los efectos de las personas son aleatorios y los efectos de los elementos son fijos (Mixed en la sintaxis).


Dos factores, efectos aleatorios Si los efectos de las personas y de los elementos son fijos (Random en la sintaxis).


Un factor, efectos aleatorios. Si los efectos de las personas son aleatorios. (One way en la sintaxis).  Siempre da los valores más chicos. Se usa cuando hay un conjunto grande de evaluadores y cualquier juez hace la primer evaluación y cualquier juez hace la segunda. Es Oneway porque no hay esfuerzos para determinar la influencia del juez, solo pesan los efectos de las personas.


(El más usado es el de efectos mixtos, considerando los inidividuos al azar y los jueces fijos. Le sigue el de dos factores, efectos aleatorios, que considera elegidos al azar los jueces y los individuos. La distinción entre ambos es puramente teórica: arrojan las mismas cifras).


******


Habrá que elegir un tipo:


Consistencia (Aquí importa fundamentalmente la correlación entre ambas medidas; si cuando una medida sube sube la otra).


Acuerdo Absoluto (Aquí importa fundamentalmente que los valores sean iguales, no solo la correlación).



******


Después habrá que elegir entre:


Single measures (Medidas únicas). Me hace falta para evaluar la calidad de mi medida si voy a trabajar con un solo juez.


Average measures (Medidas promedio). Normalmente nos interesa esta medida promedio. Por ejemplo si pensamos tomar como medida el promedio de las medidas y no una sola.



******



Dice la ayuda del SPSS:



Coeficiente de correlación intraclase. Genera medidas sobre la consistencia o sobre el acuerdo de los valores entre los propios casos.
• Modelo. Seleccione el modelo para calcular el coeficiente de correlación intraclase. Los modelos disponibles son: Dos factores, efectos mixtos; Dos factores, efectos aleatorios y Un factor, efectos aleatorios. Seleccione Dos factores, efectos mixtos, si los efectos de personas son aleatorios y los efectos de elementos son fijos, Dos factores, efectos aleatorios, si los efectos de personas y los efectos de elementos son aleatorios; o Un factor, efectos aleatorios si los efectos de personas son aleatorios.
• Tipo. Seleccione el tipo de índice. Los tipos disponibles son: Los tipos disponibles son: Consistencia y Acuerdo absoluto.
• Intervalo de confianza. Especifica el nivel para el intervalo de confianza. El valor por defecto es 95%.
• Valor de prueba. Especifica el valor hipotetizado para el coeficiente, para el contraste de hipótesis. Este valor es el valor con el que se compara el valor observado. El valor por defecto es 0.


En el transcurso de la investigación clínica es frecuente, al igual que en otras disciplinas, la evaluación de la fiabilidad de las medidas realizadas, pudiéndose distinguir dos tipos de situaciones diferentes: a) aquellas en las que se determina el grado de estabilidad o consistencia conseguido en los resultados cuando se repite la medición con el mismo instrumento en condiciones idénticas, y b) aquellas en las que se determina hasta qué punto los resultados obtenidos con diferentes instrumentos de medida o con diferentes observadores concuerdan, o son equivalentes. 

Sean dos médicos que miden a 10 pacientes en ciertos rasgos y obtienen estas medidas:

135,00 140,00
140,00 145,00
130,00 135,00
145,00 150,00
140,00 145,00
150,00 160,00
140,00 145,00
135,00 140,00
140,00 145,00
135,00 145,00

Podemos asumir que la varianza se debe a tres componentes:

a) la varianza entre los pacientes
b) la varianza debida a los médicos
c) una varianza aleatoria.


Valores convencionales para ICC.
  • < 0,40 – Pobre.
  • 0,40 – 0,59 – Suficiente.
  • 0,60 – 0,74 – Bueno.
  • 0,75 – 1 – Excelente.

"La estimación del CCI presentada para el ejemplo de más arriba se ha desarrollado bajo la condición de un modelo de efectos aleatorios. Este modelo es apropiado cuando los observadores implicados en la medición, los médicos A y B en el ejemplo, representan una «muestra» aleatoria de la población de posibles observadores (p. ej., otros médicos del hospital) que en el futuro harán uso del instrumento evaluado (el esfigmomanómetro)". Nota: es el modelo random del SPSS.

"Cuando los observadores que intervienen en el estudio son los únicos que participarán en el mismo, es necesario un modelo de efectos fijos. En el caso, por ejemplo, en el que deseamos valorar la concordancia de las mediciones de la frecuencia cardíaca obtenidas en 10 pacientes por 2 médicos diferentes: un médico A, jefe del servicio, y un médico B, en período de formación. El objetivo es conocer la magnitud de las discrepancias entre ambos y determinar si el médico A puede ser sustituido por el médico B en esa tarea. Por lo tanto, estaremos exclusivamente interesados en la comparación de los resultados obtenidos por estos 2 médicos y no desearemos generalizar los resultados al conjunto de médicos que miden la frecuencia cardíaca en el hospital". Nota: en este caso en SPSS usaríamos modelo mixto, ya que hay una fuente de variación que son los pacientes, además de los efectos fijos de los médicos. 

Supuestos para el cálculo del ICC: Normalidad de las distribuciones de las variables, homocedasticidad e independencia de errores.

Además, el ICC es dependiente del rango de variación. Aumenta cuando aumenta el rango de variación, al igual que la r de Pearson.

Alternativas al ICC

1) Método gráfico de Bland Altman.
2) Coeficiente de correlación de concordancia de Lin.



Extensión del uso de la ICC


La ICC no se ha extendido mucho en el área médica a pesar de que es un índice muy adecuado. Pero no tiene una interpretación clínica obvia. 


Hay otra forma más intuitiva de abordar la concordancia: Bland y Altman.




Consultado:


Videos



























martes, 15 de diciembre de 2015

Kappa de Cohen: un índice de concordancia entre mediciones nominales. Texto e hipervíonculos a videos ajenos.


En ocasiones se usa más de un método para establecer el valor de una variable nominal. Por ejemplo, se establece si un paciente padece una fractura mediante a) una resonancia magnética y b) un gammagrafía. ¿Mediante qué estadístico mediremos en hasta donde ambos métodos concuerdan?

O se pueden tomar placas radiográficas y que dos técnicos informen si se da un proceso inveccioso o no. ¿Cómo se mide su grado de acuerdo o concordancia?

Para medir el grado de acuerdo en la medición de una variable cualitativa, ya sea entre dos técnicas o entre dos jueces, se usa el índice Kappa de Cohen. Este índice mide cuánto por arriba del azar están los acuerdos entre técnicas o jueces.

Es condición para calcular este índice que ambos jueces clasifiquen en igual número de categorías: no puede clasificar uno de ellos en cierto/falso y el otro en cierto/falso/indeterminado.



En la imagen adjunta hay concordancia en las celdas con círculos rojos: ambos métodos (o jueces) dicen que sí para las observaciones de la celda superior izquierda y ambos dicen que no para la celda inferior izquierda.

En cambio hay discordancias en las celdas no resaltadas: uno dice que sí y el otro que no.

Aún si uno de los jueces dijera que sí o que no al azar habría concordancias: por eso la Kappa de Cohen mide las concordancias por encima de lo esperable por azar.

¿Cuando la concordancia se considera convencionalmente buena? Cuando Kappa alcanza 0,6 o más. El máximo teórico posible es +1. Si ambos jueces establecieran medidas al azar esperaríamos una concordancia de 0.


Nótese que aquí se están midiendo las concordancias entre DOS métodos o jueces cada uno de los cuales califica a todos las unidades de la base: si fueran más jueces o técnicas habría que hacer un análisis llamado KAPPA DE FLEISS, que no se ve aquí.

Y si las categorías en que clasifican los métodos o los jueces fuesen ordinales, habría que emplear una variante: la KAPPA PONDERADA.




***

Material de lectura sobre Kappa de Cohen en SPSS:

https://statistics.laerd.com/spss-tutorials/cohens-kappa-in-spss-statistics.php#procedure

***

Videos sobre Kappa de Cohen en SPSS:

https://www.youtube.com/watch?v=Bo1gVbmWQs8


https://www.youtube.com/watch?v=fOR_8gkU3UE&index=2&list=PLDDIF8TO8p9ukK77CfG1JA6f-ooy4H-GP




jueves, 10 de diciembre de 2015

Ejercicio sobre relaciones bivariadas (sin soluciones). Base de Personas de ECH 2014


Ejercicio que explora los ingresos por ocupación principal de hombres y mujeres, la cantidad de horas trabajadas por ambos sexos, el tamaño de las empresas en que trabajan, la categoría de la ocupación, etc.


https://drive.google.com/open?id=1EXYJyhF95RyShv3xJd4lOVSDrWcdIPx6