Curso de SPSS: marzo 2016

miércoles, 30 de marzo de 2016

Riesgo Relativo (Risk Ratio, RR). Razón de ventajas (Odds Ratio, OR). Texto y Video.

El riesgo relativo (risk ratio, RR, razón de riesgos) es el cociente de dos riesgos. El que existe en un grupo que sufre una exposición a un factor de riesgo comparado con otro grupo que no sufre esa exposición.

En el ejemplo que se verá, es el riesgo de contraer cáncer entre el grupo de fumadores comparado el riesgo de contraerlo del grupo de no fumadores.

También se puede usar en el contexto de situaciones sociales: por ejemplo el riesgo de delinquir entre quienes abandonaron tempranamente la educación comparado con el riesgo de quienes siguieron estudiando.

El riesgo relativo se puede calcular en el SPSS, pero las tablas tienen que tener una distribución muy precisa de variables y valores.

La variable independiente debe ir en filas.
La variable dependiente debe ir en columnas.
Los expuestos deben ir en el renglón superior
Los que sufren el evento de interés deben ir en la columna de la izquierda.

Si se usa esta disposición, el SPSS da correctamente el RR y su intervalo de confianza.

Si no nos acordamos de cómo van variables y celdas podemos recurrir a un calculador externo: Open Epi es una buena opción. Nos fijamos qué nos pide su formulario y apretamos calcular.

Lo mismo vale para el OR (odds ratio, razón de ventajas en SPSS). Se necesita la misma disposición de celdas, y si no la recordamos probablemente sea aconsejable usar Open epi.

Se adjunta una base y un vídeo que deberán ser descargados para poder trabajar con ellos. Están en un archivo rar listo para bajarse.

viernes, 25 de marzo de 2016

Numero necesario para tratar. Número necesario para dañar. Texto y Video.

El número necesario para tratar (NNT, number needed to treat) es una medida de eficacia de los tratamientos. También puede ser usado para medir la eficacia de políticas, p.e. contra la reincidencia penal, etc.

Responde a la pregunta ¿a cuántas personas debo tratar para mejorar a 1 más?

Para el cuadro de arriba (presentado como porcentajes), los tratados obtuvieron 2 éxitos más que los no tratados. Pero para obtener esos dos éxitos adicionales, debimos tratar a 100 personas.

Aquí el NNT = 100/2 = 50.

El NNT más pequeño que puede tener un medicamento es 1. Esto se daría si a) todo tratado se cura, y b) ningún no tratado se cura. Si un NNT es muy bajo, el medicamento es muy eficaz.

Si un NNT es muy alto, el tratamiento tiene muy poca eficacia por sobre el no tratamiento.

********

Una medida similar conceptualmente es el NNH (number needed to harm, número necesario para dañar). Se usa para medir efectos no deseados, daños, etc.

Un tratamiento puede ser bueno, pero tener efectos secundarios. Entonces podemos preguntarnos cuantos tratamientos son necesarios para que aparezca un efecto secundario adicional por sobre los que se presentarán en el grupo de control.

Los efectos no deseados de cualquier tipo los designamos por comodidad como malos resultados.

En la tabla de arriba (se presenta como porcentajes) tenemos 17 malos resultados adicionales en los tratados con respecto a los no tratados. Para obtener esos 17 casos adicionales fueron tratadas 100 personas. El NNH es de 100 / 17 = 5.9. Cada 5.9 personas adicionales tratadas, se obtiene un caso adicional de efectos no deseados.

********.

Usando calculadoras en línea, se pueden hallar NNT y NNH con sus intervalos de confianza.

********.

Se adjuntan dos bases (una para NNT y otra para NNH) conjuntamente con un video que muestra el trabajo previo en SPSS y la consulta en línea, en un archivo rar que debe ser bajado.

domingo, 20 de marzo de 2016

Cómo generar casos mediante sintaxis en SPSS. Texto.

Lo que sigue no tiene importancia para el analista práctico de datos.

Simplemente es cómodo para generar rápidamente muchos casos y luego adjudicarles valores aleatorios.

Si deseamos crear, digamos 98.000 casos, podemos recurrir a la siguiente sintaxis:

INPUT PROGRAM. 
LOOP #i=1 to 98000. 
COMPUTE id=#i. 
END CASE. 
END LOOP. 
END FILE. 
END INPUT PROGRAM. 
EXECUTE.

Set seed = 1234.

Si usted abre un archivo de sintaxis nuevo, le pega la sintaxis de arriba

y la corre, tendrá una base con 98000 casos y una variable llamada Id, que

toma valores consecutivos.

El último comando, "set seed = 1234", no es necesario para la creación de

casos, pero si usted ha de crear variables aleatorias y desea que siempre

se creen los mismos números, deberá fijar la semilla de aleatorización en

un cierto valor cualquiera. Aquí se eligió 1234, pero se podía haber elegido

cualquier otro.

martes, 15 de marzo de 2016

Indice PHEEM: generación y chequeo de consistencia de dimensiones con Alfa de Cronbach (ejercicio sin solución)

El índice PHEEM fue diseñado para medir la calidad del trabajo y enseñanza que reciben los médicos cuando trabajan y cursan sus futuras especializaciones.

Se adjunta un .doc con el problema, un .xls con información sobre el índice, una sintaxis que genera una base sobre la cual se trabajará y, en forma suplementaria, dos artículos donde los interesados podrán enterarse más a fondo del índice.

Como parte del ejercicio se pide analizar la consistencia de conjuntos de ítems usando alpha de Cronbach.

https://drive.google.com/file/d/0B9C7VyfotFyJNXRmamYzM1YwdDg/view?usp=sharing

jueves, 10 de marzo de 2016

Alfa de Cronbach. Texto y video.

El alfa de Cronbach es una medida de interrelación de un conjunto de ítems.

Cuando intentamos medir un único aspecto "unidimensional" se supone que todos sus indicadores se correlacionan positivamente entre sí. "Unidimensional" está puesto entre comillas porque es un concepto que puede tener sus complicaciones.

Un autor (Klaas Sijtsma) sostiene que no debemos dar por descontado que, si hacemos un análisis factorial de los ítems, encontraremos una solución adecuada de un solo factor.

Según dicho autor "... all that alpha can reveal about the “interrelatedness of the items” is their average degree of “interrelatedness” provided there are no negative covariances, and keeping in mind that alpha also depends on the number of items in the test (...).

"Alpha is not a measure of internal consistency. Neither is it a measure of the degree of unidimensionality".

Para dicho autor, el alfa de Cronbach no debe ser interpretado como una medida de consistencia interna sino, como se decía antes, como una medida del grado de correlación entre los ítems.

"Because this says very little if anything about internal consistency no matter how it is defined, one wonders why the internal consistency interpretation of alpha is so persistent."

Sean por ejemplo varias afirmaciones que intentan medir el nivel de empatía y sobre las cuales el entrevistado tiene que manifestar su acuerdo o desacuerdo:

item1: Me entristece ver a un extraño solitario
item2: Me siento emocionalmente involucrado en los problemas de mis amigos
item3: Si veo una persona llorando, eso me trastorna
item4: No me siento bien cuando veo a otros deprimidos
item5: Me siento triste cuando veo a viejos sin nadie que los ayude
item6: Yo permanezco tranquilo cuando los otros se excitan (Invertido)
item7: Me cuesta entender cómo otros se emocionan con tonterías (Invertido)

Se pretende que todos estos indicadores miden empatía. En los 5 primeros ítems, manifestar acuerdo expresa empatía, y en los 2 últimos es el desacuerdo el que la manifiesta.

Si hemos de formar un índice de empatía reuniendo los 7 ítems, el 6 y el 7 deben ser invertidos.

Una vez que todos los ítems están en el sentido correcto, si todos miden lo mismo, habrá correlaciones positivas entre ellos: cuando aumentan unos, aumentan los otros. Esta podría ser la gráfica de las relaciones entre los ítems luego de invertir los ítems que corresponda:

El alfa de Cronbach en algún sentido mide y resume el grado de correlación entre los distintos ítems.

El alfa de Cronbach toma usualmente valores entre 0 y 1, aunque podría tomar valores negativos en el caso de ítems con correlaciones negativas entre sí, lo que no es esperable en la confección de índices.

Convencionalmente se consideran el alfa de Cronbach según estos criterios:
0.7 - 0.8 aceptable
0.8 - 0.9 bueno
0.9 - 1 excelente.

Pero los criterios anteriores son reglas generales que deberán ser usadas según las circunstancias.

¿De qué depende el valor del Alfa de Cronbach? a) de la correlación entre los ítems, y b) del número de ítems: cuántos más ítems más tiende a subir el alfa de Cronbach.

En nuestro ejemplo estamos midiendo empatía con un set de 7 ítems. Concibamos a nuestos ítems como 7 posibles ítems elegidos al azar de una población de infinitos ítems.

Podemos pensar el alfa de Cronbach como la correlación promedio entre los puntajes dados por todos los sets de igual cantidad de ítems.

O sea: para la cantidad de 7 ítems podríamos tener infinitos conjuntos de 7 ítems. Estos nos darían infinitos puntajes para la población medida con estas escalas. Si promediáramos las correlaciones entre esas infinitas medidas, nos daría el alfa de Cronbach.

***

Output principal del Alfa de Cronbach

En el vídeo adjunto se muestra como pedir un alfa de Cronbach. Aquí se enfatizará en las principales salidas.

En la salida usualmente lo más relevante es el valor del Alfa de Cronbach (aquí 0.858), y las columnas señaladas.

La columna correlación total de elementos corregida, nos da la correlación de cada ítem con la suma del resto de los ítems. Aquí vemos que el ítem8 correlaciona muy pobremente (r = 0.090) con la suma del resto de los ítems. Eso nos sugiere sacar el ítem8, que encaja mal.

La columna "Alfa de Cronbach si el elemento se ha suprimido", nos indica cuál sería el valor del alfa si cada uno de los elementos fuera retirado del conjunto. Aquí vemos que si retiramos el ítem8, el alfa de Cronbach pasaría de su valor actual, 0.858 al valor de 0.912. Nos reafirma la conveniencia de eliminar el ítem8.

Entonces aquí sacaríamos el item8 del índice y volveríamos a pedir el nuevo alfa de Cronbach.

Una vez que hemos elegido los ítems que quedarán en definitiva, procedemos a calcular el índice promediando o sumando los ítems.

Sigue video que muestra el cálculo del Alfa de Cronbach en SPSS, y la base sobre la cual se calcula.

https://drive.google.com/file/d/0B9C7VyfotFyJaUZRSVp0d1Fxb28/view?usp=sharing

sábado, 5 de marzo de 2016

Fuerza de la asociación en relaciones lineales entre variables de escala. Bootstrap. Texto y Video.

Se recomienda entonces, para los resultados principales, dar medidas de tamaño del efecto e intervalos de confianza para ellas.

Veamos el caso de variables de escala que se relacionan linealmente.

Cuando tenemos dos variables de escala que se relacionan linealmente, y nos centramos en su correlación, la medida de asociación habitualmente usada es la r de Pearson.

"The index of choice in a correlational design is the product–moment correlation coefficient, r, which is calculated in the traditional fashion, and is obtainable in the standard output of statistical packages; r is a widely used index of effect that conveys information both on the magnitude of the relationship between variables and its direction (Rosenthal, 1991). The possible range of r is well known: from −1.00 through zero (absolutely no relationship) to +1.00." (1)

¿Y cómo establecer para la r de Pearson su intervalo de confianza? Una posibilidad es recurrir a algún calculador online:VassarStats, SDM, etc. Otra posibilidad es hacer uso del bootstrapping. Ambas formas de calcular el intervalo de confianza se muestran en este vídeo.

Ahora bien, cuando creamos un modelo de regresión lineal, es imprescindible reportar también otra cantidad: cuanto cambia la variable dependiente por cada unidad de cambio en la independiente.

Pero para tomar esta temática, será necesario ver antes regresión lineal.

(1) How to Select, Calculate, and Interpret Effect Sizes