miércoles, 30 de noviembre de 2016

Regresión lineal. Interacción entre dos variables continuas. Video.


En el video adjunto, se plantea el problema de predecir la pérdida de peso (loss) asociada a un programa de ejercicios.

Dos de las variables que caracterizan a ese programa de ejercicios son Hours (horas de ejercicio promedio semanal) y effort (esfuerzo promedio, según evaluación subjetiva del participante, medida en una escala de 0 a 50).

En el ejercicio se introducirán las variables horas y esfuerzo. Pero como no es lo mismo una hora de esfuerzo suave que una hora de esfuerzo intenso, se introduce un término de interacción (horas * esfuerzo) y se analiza su significación.

Como es significativo se retiene en el modelo, y se reflexiona sobre los distintos valores de las horas a los efectos de la pérdida de peso, según los niveles de esfuerzo.




https://drive.google.com/file/d/0B9C7VyfotFyJZ3R0aHVGcmY2dlU/view?usp=sharing

viernes, 25 de noviembre de 2016

Regresión lineal. Variables dummy. Video

Las variables dummy son variables dicotómicas que toman usualmente los valores 0 o 1: 0 para no y 1 para sí.

Si deseamos incorporar a un análisis una variable con varias categorías, por ejemplo partido político, no la podemos incorporar directamente a una regresión. Lo que sí podemos hacer es trasladar su información a variables dummy.

Si consideramos 5 partidos políticos, nos alcanza con crear 4 variables dummy. Consideremos una variable con los códigos: 1. Frente Amplio 2. Partido Nacional 3. Partido Colorado 4. Partido Independiente y 5. Unidad Popular.

Con la información de esa variable podríamos crear 4 variables dummy:
Frente Amplio (1 sí, 0 no)
Partido Nacional (1 sí, 0 no)
Partido Colorado (1 sí, 0 no)
Partido Independiente (1 sí, 0 no)

Entonces un colorado, por ejemplo, tendrá 1 en la variable Partido_Colorado y 0 en las otras variables dummy.

Un frenteamplista tendrá 1 en la variable Frente_amplio y 0 en las otras variables dummy.

¿Y cómo identificaríamos a los partidarios de la Unidad Popular? Porque tendrían 0 en todas las demás variables dummy. Como solo hay 5 opciones y no son de ninguna de las otras 4, son necesariamente de la quinta.

En el ejemplo de la base, se tratará de predecir salario a partir de los créditos de estudio y de las orientaciones de estudio. Esta variable tiene originalmente tres categorías y su información se llevará a dos variables dummy y se incorporará en un modelo de regresión sin interacción.


https://drive.google.com/file/d/0B9C7VyfotFyJSUF4RlpQRlZReU0/view?usp=sharing

domingo, 20 de noviembre de 2016

Regresión lineal. Interacción con un predictor continuo y un predictor dicotómico. Video


En el video cuyo vínculo se adjunta, se estudia un  caso de interacción en base a datos simulados sobre la evolución del peso del ganado conforme pasa el tiempo.

Las variables son Peso (variable dependiente), Edad_Meses y Raza.

En la base hay una interacción: el paso del tiempo hace engordar a una raza, pero no a la otra. Hay un efecto diferente del paso del tiempo que depende de otra variable, la raza.

Aquí llamaremos a la raza "modificadora del efecto" del tiempo sobre el peso.

En una regresión lineal, el proceso generalmente usado para modelar una interacción es introducir una variable producto de los predictores que interactúan.


https://drive.google.com/file/d/0B9C7VyfotFyJRDl6Wm5Kb2FUckU/view?usp=sharing

martes, 15 de noviembre de 2016

Regresión lineal. Interacción entre dos variables predictoras dicotómicas. Video.



 El vínculo adjunto da acceso a una base de datos y a un video.

La base de datos tiene dos variables dicotómicas (mujer y tomó_medicamento) que interactúan con una tercera, presión arterial.

En el ejemplo, el efecto del medicamento sobre la presión arterial "DEPENDE DE" el sexo del paciente. En las mujeres el efecto es mucho mayor.

¿Cuál es el efecto del medicamento sobre la presión? Depende del sexo.

El sexo en esta relación se llama "variable modificadora del efecto".

Para modelar una interacción en un modelo de regresión lineal, se debe poner el producto de las variables predictoras que interactúan.

¿Y qué pasa si no ponemos el término de interacción en el modelo? Que modelamos el promedio de la acción del medicamento sobre hombres y mujeres conjuntamente.

En particular si son muy distintos, conviene posibilitar su cálculo por separado.




https://drive.google.com/file/d/0B9C7VyfotFyJZmFiU3FmQmZLN3c/view?usp=sharing