lunes, 16 de enero de 2017

Construcción de modelos: visión ligeramente simplificada basada en Hosmer y Lemeshow




  1. Comience seleccionado un conjunto de variables predictoras.
  2. Evalúe cada predictor en regresiones "univariadas", es decir, con un solo predictor (Si la variable fuera categórica, el predictor estaría constituido por un conjunto de variables dummy).
  3. Retenga todos los predictores que tengan un p-valor <.25
  4. Corra una regresión múltiple con todos los predictores retenidos.
  5. Uno por uno, elimine los predictores que no son estadísticamente significantes. (En ciertas regresiones hay más de un test de significación para eliminar variables. Por ejemplo, en regresión logística tenemos el Wald test y el lrtest. Si se desea eliminar una variable señalada por el Wald test para ser eliminada, se deberá verificar demás con el lrtest. Si no se logra verificar su falta de significatividad, se deberá mantener en el modelo).
  6. Para cada predictor, se considerará alterar la forma funcional: añadir términos cuadráticos y/o cúbicos, o sustituirlo por su logaritmo (nota: esto es relevante en presencia de relaciones curvilíneas).
  7. Considere un número limitado de interacciones plausibles entre los predictores. Añada las interacciones significativas, o interacciones que alteran la intepretación de los predictores de una manera marcada.
  8. Chequée la bondad del modelo mediante pruebas diagnósticas.


Nota: Este trabajo se apoya en el documento publicado en  sites.harvard.edu/fs/docs/icb.topic1217366.../modelselect1.docx


Nota personal:

No todas las interacciones tienen igual importancia. Pensemos en la siguiente interacción entre sexo, método de enseñanza y aprendizaje. Para el método B, el coeficiente del método de aprendizaje, si incorporamos la interacción, puede ser de 16 para los hombres y de 17 para las mujeres. Si no se incorpora la interacción, nos queda un coeficiente groseramente de 16.50. No parece preocupante no introducir esta interacción, aunque se muestre significativa en la muestra.

Caso muy distinto es si la interacción entre sexo, método de enseñanza y aprendizaje es de tal forma que con el método B el coeficiente para las mujeres es 17 y para los hombres es 4, o peor aún negativo. Aquí es relevante incorporar la interacción.

No hay comentarios: