martes, 20 de septiembre de 2016

Lazarsfeld. Espureidad

Una relación espuria es una covariación estadística entre dos variables, que puede llevarnos a creer que existe causalidad, pero en donde la covariación es causada por una variable externa, anterior.


Una relación espuria es la que se da entre consumo de helados y ahogamientos. La relación, en sentido estadístico, es plenamente real: cuando sube el número de helados sube el número de ahogamientos. Pero no se debe por ejemplo a que la gente que come helados se acalambra cuando nada y por eso se ahoga. Los helados no están causalmente asociados con los ahogamientos.

Sucede que existe una variable anterior a ambas, en este caso el clima, que explica la covariación entre helados y ahogamientos. Cuando hace calor, la gente consume más helados, y también nada más y se ahoga más.

Al ser la relación espuria, si actuaramos sobre el número de helados no estaríamos actuando sobre los ahogamientos. Si cerraramos todas las heladerías la gente se seguiría ahogando con igual intensidad.


La variable con que se controla, que por comodidad llamamos antecedente siguiendo a Babbie, puede a) anteceder a ambas en el tiempo y b) puede estar asociada a X y Y, pero sin estar en su cadena causal.

Veamos un ejemplo de la situación b). Se halla una relación entre beber alcohol y cáncer de pulmón. Quienes beben más alcohol tienen más cancer. Esta es una relación espuria, porque no es el alcohol el que causa el cancer de pulmón, sino el cigarro. ¿Por qué aparece la relación? Porque quienes beben más alcohol acostumbrar fumar más. Si controlamos por la variable fumar, la relación alcohol-cancer de pulmón desaparece. ¿Es antecedente fumar de consumir alcohol? En sentido estricto no. Pero sin embargo la relación entre beber y cáncer de pulmón es espuria: desaparece cuando controlamos por la variable de control fumar.

Nótese que la variable fumar no está en el camino causal entre beber y cáncer de pulmón: si estuviera en el camino beber >fumar>cáncer de pulmón estaríamos en una situación distinta a la espureidad.

Pero aquí la relación beber cáncer de pulmón es espuria. Si impidiésemos la bebida no estaríamos disminuyendo los casos de cáncer de pulmón.

Las relaciones espurias son estudiadas en múltiples ciencias, aunque no necesariamente con la terminología de Lazarsfeld. En epidemiología, por ejemplo, se habla de una relación entre dos variables confundida por una "factor de confusión". Ese factor, fumar, interviene en la relación entre beber y tener cáncer de pulmón.

Sigue vínculo para descargar vídeo y bases.



https://drive.google.com/open?id=0B9C7VyfotFyJajVBbmVrckwwZnM


jueves, 15 de septiembre de 2016

Lazarsfeld. Introducción



El modelo de elaboración de Lazarsfeld estudia qué pasa cuando se tiene una relación original de dos variables, y a continuación se introduce una tercera.

Es habitual ver a Lazarsfeld en sociología como una forma de introducción al análisis multivariado, y así lo veremos aquí: comprenderlo ayudará a mejor interpretar los resultados de distintas técnicas multivariadas: regresión lineal múltiple, regresión logística múltiple, análisis de supervivencia, etc. Probablemente razones de tiempo impidan que se vean todas en este curso.

Sigue vídeo y tres artículos.


Vídeo:
https://drive.google.com/file/d/0B9C7VyfotFyJejBQSzFNX0ctSlk/view?usp=sharing



Tres artículos sobre el modelo de elaboración:
https://drive.google.com/open?id=0B9C7VyfotFyJTERLVDJseXhKa0U

miércoles, 14 de septiembre de 2016

Ejercicio con Fusión de Archivos y Variables de Cadena (sin solución)


Ejercicio que solicita la fusión de varios archivos, en orden a identificar sospechosos de apropiación indebida.

Varias de las variables son de cadena, lo que exige trabajar con este tipo de comandos.


https://drive.google.com/open?id=1UThpC3VzZ86FB7F1hQhjupvdsTPEpbJo

sábado, 10 de septiembre de 2016

Fusión de archivos (ejercicio 2 sin solución)

El presente ejercicio solicita realizar tres fusiones de archivos en diferentes modalidades:

añadir casos
añadir variables uno a uno
añadir variables uno a varios.

Se fusionarán:
ArchivoBalnearios1 con ArchivoBalnearios2

Gimnasio1 con Gimnasio2

ArchivoMesAgosto con ArchivoMesJulio



Antes de fusionar corresponderá analizar las bases para comprender el tipo de fusión necesario.

Si hubiera algún inconveniente para fusionar los archivos, deberá ser solucionado antes de proseguir con la fusión.


https://drive.google.com/open?id=0B9C7VyfotFyJcTY4SG1ZeVhacUE

martes, 6 de septiembre de 2016

Fusión de archivos. Añadir casos, añadir variables 1 a 1 y añadir variables 1 a varios. (Ejercicio sin solución)


Ejercicio muy simple que muestra las tres formas de fusión: añadir casos, añadir variables uno a uno y añadir variables uno a varios.

https://drive.google.com/open?id=1nLEImbDKAVLY1l0U381sOUwYpp1zNawK

lunes, 5 de septiembre de 2016

Fusionar archivos: añadir variables uno a varios. Video.

En ocasiones deseamos reunir dos archivos de tal forma que la información de un renglón va a varios renglones.

Por ejemplo, tenemos varias personas con sus respectivas categorías laborales, y un archivo donde se indica la categoría laboral y el sueldo que le corresponde. Aquí un mismo sueldo irá a varios renglones.






https://drive.google.com/file/d/0B9C7VyfotFyJMktZVW9xMGpZSEU/view?usp=sharing