viernes, 31 de marzo de 2017

Regresión logística binaria. Chequeo de la linealidad de la relación entre una variable continua y el ln(odds). Método gráfico, tomado de Bioestadística Amigable. Video


La ecuación de regresión logística es una ecuación de regresión lineal en donde Y = ln(odds).

En particular, para una variable continua, la ecuación será:

ln(odds) = constante + b1 * x1.

Pero para que una regresión lineal funcione correctamente, la relación de la variable dependiente con la independiente debe ser lineal.

Pero ¿cómo chequear si x1 y el ln(odds) se relacionan linealmente?

Hay más de una forma de hacerlo. Aquí mostraré el método usado por Miguel Angel Martínez y otros en el libro Bioestadística Amigable de editorial Elsevier.


https://drive.google.com/open?id=0B9C7VyfotFyJeEQyWE5JSklfVDg


miércoles, 29 de marzo de 2017

Ejercicio de mediación, con análisis estratificado y regresión logística. Video

Se analiza relación entre alcohol y cáncer de hígado, presumiblemente mediado por cirrosis.


Archivo y letra del problema

Video

martes, 28 de marzo de 2017

Regresión logística binaria: intermediación. Video


En ocasiones pensamos que una primera variable (variable1) actúa sobre una segunda (variable2) y esta a su vez sobre una variable efecto.



Dado este esquema causal, la variable 1 actúa sobre el efecto de forma indirecta. Modificando el valor que toma incidimos sobre el efecto.

La variable 2 del esquema se llama variable intermedia, o a veces también variable interviniente.

Si queremos saber la magnitud del efecto total de la variable 1 sobre el efecto, ¿corresponde controlar por la variable 2?. La respuesta es no, no se debe controlar.

Sin embargo hay ocasiones en que tenemos la relación entre la variable 1 y el efecto e introducimos en el modelo la variable 2. ¿Para qué lo hacemos? Para verificar la hipótesis de que la variable 2 es una variable intermedia. Si la variable 2 es efectivamente intermedia, la variable 1 va a pasar a ser no significativa y la variable 2 sí lo será

Pero, de nuevo, si nuestro foco está en conocer el efecto total de la variable 1 sobre el efecto, no tiene sentido controlar por la variable 2.


https://drive.google.com/open?id=0B9C7VyfotFyJaGwtMmJYZTFqN1U

sábado, 25 de marzo de 2017

Ejercicio sobre supresión y confusión en el contexto de una regresión logística (sin solución)


Se analiza a nivel primero de tablas de contingencia y luego a través de regresiones logísticas la relación primero entre aburrimiento y comisión de errores en tareas muy simples, y luego esta relación se controla con la variable inteligencia.



https://drive.google.com/open?id=0B9C7VyfotFyJUEJEMmU3SzVaajg

lunes, 20 de marzo de 2017

Relación logística binaria: confusión (ejemplo 2: supresión). Video


Hablamos de confusión cuando si introducimos una tercera variable en una relación bivariada, cambia de manera más o menos importante la magnitud del efecto calculado.

En el ejemplo que sigue, se intenta predecir la probabilidad de un grupo de países de obtener puntajes altos en las pruebas Pisa. Se utilizaron para intentar la predicción dos variables de escala: salario de los docentes y gastos por alumno.

En la primera regresión logística, con variable dependiente Puntaje Pisa y con variable explicativa Salario Medio Docente, el Odds ratio fue de 1.397.

Luego se introdujo en la regresión logística una segunda variable predictora: Gasto por alumno. Y entonces, el OR para salario medio docente creció: pasó a 1.535.

La relación original Puntajes Altos en pruebas Pisa y Salario Docente estaba parcialmente suprimida. Se vio en su pleno efecto cuando se introdujo Gasto por Alumno.


https://drive.google.com/open?id=0B9C7VyfotFyJZGt1emcxdmJNXzQ

sábado, 18 de marzo de 2017

Ejercicio sobre confusión, con análisis estratificado y regresión logística. Video


El ejercicio consiste en ver las tasas de muertes que tienen dos hospitales. Primero se ven las tasas crudas y luego controladas por la gravedad inicial de los casos.



Letra del problema y base de datos

Video

miércoles, 15 de marzo de 2017

Regresión Logística Binaria: Confusión (ejemplo 1: espureidad). Video


El término confusión se refiere a la presencia de terceras variables que alteran las relaciones entre otras variables.

En el ejemplo que se verá, hay una asociación aparente entre alcohol y cáncer de pulmón. Quienes toman más alcohol tienen más cáncer de pulmón.

Pero esto en realidad no es indicio de una relación causal. Esta relación está "confundida" por la presencia de otra variable: cigarrillo. Sucede que quienes fuman más también toman más, y por ello entre quienes toman aparecen más cánceres de pulmón.

Aquí se verá el cambio importante en las OR (expB) como indicativo de fenómenos de confusión.

Es del caso señalar que la confusión significa de manera amplia alteración en la apreciación de la relación causal entre dos variables. Luego de controlar, la relación origina se puede mostrar más fuerte, más débil o incluso nula. Lo que caracteriza a la confusión es la variación en el OR luego de que se controla.

Para que la magnitud de la confusión sea relevante, algunos autores piden que el OR cambie, subiendo o bajando, al menos un 20%.


https://drive.google.com/open?id=0B9C7VyfotFyJRWV3dmJEOHhMX3c





Materiales suplementarios:

 https://www.healthknowledge.org.uk/node/803

https://www.iarc.fr/en/publications/pdfs-online/epi/cancerepi/CancerEpi-14.pdf

domingo, 12 de marzo de 2017

Ejercicio de Interacción, con análisis estratificado y regresión logística. Video.

Ejercicio en el que se muestra una interacción entre tres variables: sexo, edad y hospitalización.



Base y letra del problema

Video.

viernes, 10 de marzo de 2017

Ejercicio sobre interacción (sin solución)

Ejercicio en donde una interacción es vista primero segmentando la base, y luego introduciendo un término de interacción en el modelo.

Se pide analizar las odds relativas en presencia de interacción. ¡Cuando hay interacción los OR no son siempre iguales!


https://drive.google.com/open?id=0B9C7VyfotFyJelZaSHhvellzU1U

domingo, 5 de marzo de 2017

Ejercicio (sin soluciones) sobre interacción y su relación con Hosmer y Lemeshow

Ejercicio con un modelo que requiere de un término de interacción. Se recuerda cómo verificar que corresponde añadirlo al modelo, y se muestra el comportamiento del test de Hosmer y Lemeshow cuando está y cuando no está el término.

Finalmente se grafican los efectos de las variables en un diagrama de dispersión que muestra cómo varían las probabilidades predichas por el modelo según los valores de las variables independientes.


https://drive.google.com/open?id=0B9C7VyfotFyJU0xsRFZzTzBscTg