viernes, 25 de noviembre de 2016

Regresión lineal. Variables dummy. Video

Las variables dummy son variables dicotómicas que toman usualmente los valores 0 o 1: 0 para no y 1 para sí.

Si deseamos incorporar a un análisis una variable con varias categorías, por ejemplo partido político, no la podemos incorporar directamente a una regresión. Lo que sí podemos hacer es trasladar su información a variables dummy.

Si consideramos 5 partidos políticos, nos alcanza con crear 4 variables dummy. Consideremos una variable con los códigos: 1. Frente Amplio 2. Partido Nacional 3. Partido Colorado 4. Partido Independiente y 5. Unidad Popular.

Con la información de esa variable podríamos crear 4 variables dummy:
Frente Amplio (1 sí, 0 no)
Partido Nacional (1 sí, 0 no)
Partido Colorado (1 sí, 0 no)
Partido Independiente (1 sí, 0 no)

Entonces un colorado, por ejemplo, tendrá 1 en la variable Partido_Colorado y 0 en las otras variables dummy.

Un frenteamplista tendrá 1 en la variable Frente_amplio y 0 en las otras variables dummy.

¿Y cómo identificaríamos a los partidarios de la Unidad Popular? Porque tendrían 0 en todas las demás variables dummy. Como solo hay 5 opciones y no son de ninguna de las otras 4, son necesariamente de la quinta.

En el ejemplo de la base, se tratará de predecir salario a partir de los créditos de estudio y de las orientaciones de estudio. Esta variable tiene originalmente tres categorías y su información se llevará a dos variables dummy y se incorporará en un modelo de regresión sin interacción.


https://drive.google.com/file/d/0B9C7VyfotFyJSUF4RlpQRlZReU0/view?usp=sharing

No hay comentarios: