Si estoy fallando el Jarque-Bera pero los residuos siguen pareciendo estar normalmente en un diagrama qq e histograma, ¿es aceptable decir que mis residuos están aproximadamente distribuidos normalmente? Preguntado de otra manera, ¿cuán confiables son esas pruebas de normalidad y necesita cumplirlas para pasar la suposición de normalidad.
Respuestas
¿Demasiados anuncios?Su pregunta es muy general y es difícil de responder específicamente sin más detalles de usted.
- ¿para qué está tratando de usar estos datos?
- ¿Qué tan grande es tu conjunto de datos?
- ¿Le interesan las colas de la distribución de su muestra o el bulto?
- ¿Ha limpiado sus datos para eliminar los valores atípicos?
- El gráfico qq es sólo una prueba visual, mientras que Jarque-Berra es una estadística tan difícil de comparar los 2
- ¿Has probado otras pruebas de normalidad? Kolmogorov-Smirnov no es tan sensible a las colas como JB.
Para más información puedes buscar mucho material en Internet. Mira esto bien presentación sobre las pruebas de normalidad
Si fallo en la prueba de Jarque-Bera, pero los residuos siguen pareciendo estar normalmente en un diagrama qq e histograma, ¿es aceptable decir que mis residuos están aproximadamente distribuidos normalmente?
No, es apropiado afirmar que tienen forma de campana después de transformaciones y normalizaciones.
Preguntado de otra manera, ¿cuán confiables son esas pruebas de normalidad y necesitas cumplirlas para pasar la suposición de normalidad.
Su pregunta depende de las características de la muestra. Reformulada, su pregunta es " ¿tiene el Jarque-Bera suficiente poder para probar mi hipótesis? "
Esa es, desafortunadamente, una pregunta compleja que no genera una respuesta automática simple para este tema. El fracaso de Jarque-Bera después de las transformaciones en sus comentarios es una declaración bastante buena de que sus datos no se distribuyen normalmente. Asumiendo que el tamaño de su muestra es lo suficientemente grande para tener poder sobre la hipótesis, entonces la teoría de decisión de los Frecuentistas dice que usted debe comportarse como si los datos no se distribuyeran normalmente.
Dados los setenta años de datos sobre colas pesadas, el Jarque-Bera es ideal para detectarlas mientras que otras pruebas buscan otros tipos de salida. Alternativamente, la prueba de Shapiro-Wilk probará las perturbaciones en la posición de las estadísticas de orden. Un rechazo por parte de Shapiro-Wilk implica que no sólo sus colas están equivocadas, sino que todo está en el lugar equivocado. Si su muestra es lo suficientemente grande como para tener poder, entonces estas serían las pruebas más poderosas para su problema.
Basándose en sus resultados, debería rechazar la normalidad. Tampoco debes ir a hacer pruebas de caza con la esperanza de encontrar un resultado que se ajuste a lo que quieres. Los datos de equidad, en particular, son notoriamente no normales. Piensa en todas las transformaciones que tuviste que hacer para acercarte.
La importancia de la distribución normal para la mayoría de las aplicaciones es la existencia de una matriz de covarianza. No todas las distribuciones las tienen. Si no existe, estás en una clase diferente de problemas.
La pregunta que deberías hacerte es "si la suposición de normalidad no se sostiene, ¿qué implica esto para el específico problema que estoy enfrentando?"
El trabajo de predicción es sensible a las distribuciones involucradas. Si se trata de acciones y dada su transformación $ \log (y)$ entonces la distribución debería ser la distribución de secantes hiperbólicas, pero eso no se mantendrá necesariamente para un índice. Eso también es ignorar el impacto de los costos y restricciones de liquidez.