lunes, 25 de enero de 2016

Test H de Kruskal Wallis, una alternativa no paramétrica a ANOVA de una vía. Texto.


El test H de Kruskal Wallis es similar al test de ANOVA de una vía, pero en vez de utilizar las medidas recogidas, se usan los rangos. Se usa Kruskal Wallis, y no ANOVA, si la variable dependiente es ordinal o no es normal.

Hay estadísticos que reservan el test de Kruskal Wallis exclusivamente para cuando además de tener distribuciones no normales o heterocedásticas, los grupos difieren fuertemente en tamaño: en estas condiciones ANOVA es menos resistente a la violación de supuestos.

Kruskal Wallis permite comparar dos o más grupos independientes. ¿Qué se compara? Las medianas si la forma de las distribuciones es igual en los distintos grupos. Y si las formas de las distribuciones son distintas se compara el promedio de los rangos.

El test H de Kruskal Wallis es un test omnibus. El dirá si todos los grupos tienen la misma mediana (si las formas de las distribuciones son iguales) o si tienen el mismo promedio de rangos. Pero si no lo tienen, no indica entre qué grupos se dan las diferencias.

Si la prueba H de Kruskal Wallis dice que hay diferencias, habrá que realizar análisis post hoc para identificar entre qué grupos hay diferencias.



Premisas del test

1) La variable dependiente debe ser ordinal o de escala.

2) La variable independiente debe ser una variable categórica con dos o más grupos.

3) Las observaciones deben ser independientes dentro de cada grupo y entre grupos.

4) Para considerar el test como una comparación de medianas, las distribuciones de cada uno de los grupos deben tener la misma forma grosso modo y similar y dispersión. Sigue un ejemplo en que los grupos son aproximadamente similares.




Todos los grupos tienen un sesgo positivo, outliers en la zona alta, y el ancho de las cajas no difiere excesivamente.

En estas condiciones podremos considerar al test H de Kruskal Wallis una comparación de medianas.

****
Para ilustrar nuevamente el concepto de formas similares y diferentes, tomaremos un ejemplo de
https://statistics.laerd.com/spss-tutorials/kruskal-wallis-h-test-using-spss-statistics.php, aunque es irrealista esperar tal nivel de igualdad.



El procedimiento en SPSS

Se va a la prueba a través de Analizar > Pruebas no Paramétricas > Cuadros de diálogo antiguos > K muestras independientes




Luego se definen los grupos que se quieren comparar. Aquí compararemos los grupos del 1 al 3.





Y finalmente pedimos los resultados:




En los resultados se ve que el grupo con el rango promedio más alto es el grupo 3, y se ve que hay por lo menos una diferencia entre grupos significativa.


Luego de saber que no todos los grupos tienen iguales rangos promedio, se estudiarán las diferencias entre grupos de a dos. Puede hacerse mediante Kruskal Wallis o mediante la U de Mann Whitney. Probablemente futuras versiones de SPSS permitan hacer estas comparaciones adicionales en forma integrada.




































No hay comentarios: