martes, 30 de agosto de 2016

Fusionar archivos: añadir variables uno a uno. Video.

En ocasiones reunimos archivos que contienen distinta información, y que tienen en común una o más variables clave que nos dicen qué información debe ser juntada con otra.

Por ejemplo: tenemos un archivo de bedelía con las notas de los exámenes, en donde cada estudiante es identificado por su cédula. Y a ese archivo deseamos adjuntarle otro con la información del carné de salud, donde cada estudiante también es identificado por su cédula.




Luego de la fusión, se reunirán en filas únicas las informaciones de cada estudiante.

La variable clave puede ser una (como en el caso de la cédula) o pueden haber varias variables clave, como en el caso de Nombre_Calle, Nro_puerta y Apto. Si tenemos información sobre viviendas y estas están identificadas por su dirección, usaremos tres variables clave.

En el vídeo adjunto se mostrará como hacerlo:

https://drive.google.com/file/d/0B9C7VyfotFyJc1RSZ3BnLVFyRE0/view?usp=sharing

jueves, 25 de agosto de 2016

Fusión de archivos: añadir casos (Video)


En SPSS en ocasiones es necesario fusionar archivos con las mismas variables (o casi) y con casos distintos.

Por ejemplo, se recogen datos en tres meses consecutivos. Nos quedan tres archivos y deseamos fusionarlos para informar sobre el trimestre.

Otro ejemplo: de una misma encuesta entran datos procesadores distintos en distintos archivos. Luego es necesario reunirlos.






En la dirección conexa se entregan 6 archivos: un vídeo, 4 bases de datos para poder seguir el vídeo y un documento de notas, que sugerimos leer antes de empezar.


https://drive.google.com/file/d/0B9C7VyfotFyJTl9YcDctVE1LWUE/view?usp=sharing

sábado, 20 de agosto de 2016

Formato ancho y Formato largo.

Las bases con datos jerárquicos pueden tener formato largo o formato ancho.

Formato largo es cuando las unidades de primer nivel están hacia abajo, y formato ancho es cuando están de costado.

De otra manera: una unidad de primer nivel ocupa un renglón en el formato largo. Una unidad de segundo nivel ocupa un renglón en el formato ancho.

Aquí se ve a misma información en formato largo (amarillo) y en formato largo (verde). Este vídeo mostrará cómo SPSS permite pasar de un formato a otro, según nuestras conveniencias.



Sigue un vídeo y una base de datos. Ambos deben ser bajados para ver el vídeo y seguir el ejercicio con la base.

https://drive.google.com/file/d/0B9C7VyfotFyJRWZDeVJGdFN0Mm8/view?usp=sharing

lunes, 15 de agosto de 2016

Ejercicio (sin solución) con escalas de equivalencia



Concepto de escala de equivalencia

Para los estudios de pobreza y para el cálculo de quintiles o deciles de ingreso pueden usarse escalas de equivalencia, en vez del ingreso per cápita puro y duro.

Sea una cierta persona que vive sola en una casa. Vive con cierto nivel de confort. Si va una segunda persona a vivir con la primera, no es necesario que ese hogar doble sus ingresos para mantener el confort. Los impuestos municipales se pagan una sola vez, la calefacción igual, etc. Cuando aumenta el tamaño del hogar hay economías de escala.

De otro ángulo, no todos los miembros del hogar consumen en igual medida. Un niño de 0 años no gasta lo mismo en comida, ni en ropa, ni en atención médica que un adulto.

Los hechos anteriores invitan a construir "escalas de equivalencia".


En  http://siteresources.worldbank.org/INTPA/Resources/429966-1259774805724/Poverty_Inequality_Handbook_Ch05.pdf
Haughton and Khandker escriben:


"Equivalence Scales Poverty studies usually measure living standards using expenditure (or income) per capita. As discussed in chapter 2, because needs vary among household members, and because there are economies of scale in consumption, poverty measures based on per capita welfare indicators may not be good estimates. An alternative is to base our poverty measures on expenditure (or income) per adult equivalent. If poverty estimates are not affected by the adult equivalence weights that we choose, it is safe to say that those poverty estimates are not biased as a consequence of the weighting procedure used".

"..."

"For instance, measures of expenditure per capita routinely identify large households as being disproportionately poor; however, if there are economies of scale in consumption, this measure would overstate poverty among large households. Indeed, a measure of adult equivalence that makes a strong allowance for economies of scale might find that large households are less poor than average. In the Vietnamese case, the poverty rate for households with five or more members is 27 percent using expenditure per capita, and 23 percent using economies of scale expenditure; but for households with just one or two members, the poverty rate is 11 percent if one uses expenditure per capita, and 28 percent using the economies of scale expenditure measure. In every case the mean poverty rate over the whole sample is, by construction, 20 percent".


¿Qué razones hay para usar, conjuntamente con otras medidas, escalas de equivalencia? Ver hasta donde los hallazgos son dependientes de las medidas usadas o, por el contrario, robustos.

Haughton and Khandker escriben: "it is good practice to explore the sensitivity of one’s results—especially when measuring poverty rates—to differences in the choice of equivalence scale".



¿Por qué no son ampliamente usadas las escalas de equivalencia? Por la dificultad en acordar sobre pesos adecuados para las distintas personas del hogar.



¿Qué cambios genera la escala de equivalencia elegida, si se trabaja con una sola? Según el trabajo de la OECD citado "The choice of a particular equivalence scale depends on technical assumptions about economies of scale in consumption as well as on value judgments about the priority assigned to the needs of different individuals such as children or the elderly. These judgments will affect results. For example, the poverty rate of the elderly will be lower (and that of children higher) when using scales that give greater weight to each additional household member (Förster 1994). In selecting a particular equivalence scale, it is therefore important to be aware of its potential effect on the level of inequality and poverty, on the size of the poor population and its composition, and on the ranking of countries. Sensitivity analyses suggest that while the level and, in particular, the composition of income poverty are affected by the use of different equivalence scales, trends over time and rankings across countries are much less affected (Burniaux et al., 1998)".







Tres escalas de equivalencia ampliamente conocidas:

Sigue la descripción de tres escalas de equivalencia que han sido usadas en la OCDE, tomada de http://www.oecd.org/eco/growth/OECD-Note-EquivalenceScales.pdf:



(Nota: en la escala OECD modificada se consideran niños a quienes tienen 14 años o menos)




Ejercicio

Utilizando la ECH 2014, calcúlense los quintiles de ingresos de los hogares utilizando el ingreso per cápita (que equivale implícitamente a una escala de equivalencia donde todo miembro vale 1, con independencia de su edad y del tamaño del hogar.

Calcúlense luego los quinteles de ingreso utilizando como escala de equivalencia la escala modificada de la OECD (si se desea naturlamente pueden calcularse las otras dos escalas de adulto equivalencias de la figura).

Indique la cantidad de niños de hasta 11 años que viven en el primer quintil de ingresos, según se haya aplicado o no la escala de equivalencia.

Comente.











miércoles, 10 de agosto de 2016

Cálculo del índice de Gini


El índice de Gini puede ser calculado en SPSS usando los comandos rank cases, aggregate y compute.

Los archivos adjuntos muestran cómo hacerlo.



https://drive.google.com/open?id=0B9C7VyfotFyJMDhka3hYVXRTT1E

viernes, 5 de agosto de 2016

Ejercicio (no resuelto) de cálculo de Necesidades Básicas Insatisfechas a partir de la ECH



El ejercicio que sigue propone calcular las NBI según según fueron definidas en Uruguay 2011 con las NBI según fueron definidas en Argentina 2010.

La base utilizada es la ECH 2014.

El cálculo de las NBI se realiza para familiarizar al estudiante con la ECH. Se calculan de dos maneras ("uruguaya" y "argentina") para ampliar la utilización de variables y además para mostrar concretamente la gran sensibilidad de las medidas a las definiciones utilizadas.



https://drive.google.com/file/d/0B9C7VyfotFyJMHVQUTFrWVlFRWM/view?usp=sharing

lunes, 1 de agosto de 2016

Cálculo de clima educativo del hogar, a partir del archivo de hogares y personas (fusionado) de la ECH 2016. Video.

En esta entrada se describe con palabras cómo se calcula el clima educativo del hogar, y se muestra en video.



La definición que más ampliamente circula de clima educativo es el promedio de años de educación de las personas de 18 años o más del hogar.

La ECH no tiene una variable que indique los años aprobados por cada persona, pero sí pregunta en distintos ítems cuántos años aprobó en primaria, en secundaria básica, en UTU, en Universidad, Magisterio, posgrado, etc.

El conjunto de variables que recoge los años aprobados para la ECH 2016 es el siguiente:

e51_2, e51_3, e51_4, e51_5, e51_6, e51_7, e51_8, e51_9, e51_10 y e51_11.

Ahora bien, estas variables tienen una singularidad que se detecta al hacer frecuencias de ellas: aparecen números 9 que en realidad no responden a cantidad de años. Obviamente nadie puede salvar nueve años en la escuela ni el ciclo básico de secundaria. Ese 9 quiere decir que empezó el ciclo y que no tiene ningún año aprobado.

Por tanto, para calcular los años aprobados, lo primero que debemos hacer es recodificar los 9 que aparecen en dichas variables llevándolos a 0, que es lo real.

Y recién luego de recodificar, creamos una nueva variable Años aprobados, que es la suma de las variables antes citadas. Calcularemos los años aprobados exclusivamente para mayores de 18 años, (e27 >= 18) ya que haciéndolo así simplificamos los cálculos posteriores.


****.

Ahora se usará el comando aggregate. Nuestra variable de segmentación será la variable Número, porque las personas de un mismo hogar tienen igual valor en dicha variable. Y pedimos el promedio de años de educación del hogar, que nos quedará indicado en una variable que podemos llamar, por ejemplo, H_ClimaEducativo (por Hogar clima educativo).

Mostramos la manera práctica de hacerlo en el video adjunto.

https://drive.google.com/open?id=0B9C7VyfotFyJc2d1azk1U2tvSEE