Basándose en el gráfico, ¿diría que hay algún tipo de heteroscedasticidad en los datos? El eje Y es el residuo al cuadrado y el eje X son los valores predichos de Y
Respuesta
¿Demasiados anuncios?La pregunta debería ser: ¿Parece que hay suficiente heteroscedasticidad ¿para que no tenerlo en cuenta disminuya la calidad de la inferencia? Y es que "tener en cuenta la heterocedasticidad" (aunque sólo sea para los errores estándar robustos) no está exento de costes: con tamaños de muestra pequeños puede empeorar la fiabilidad de los resultados. Y se vuelve aún más arriesgado si se quiere aplicar el enfoque más tradicional en el que se especifica una relación funcional entre las varianzas de los errores y los regresores.
Por el gráfico, mi conjetura inicial sería "no, no es suficiente". Pero realice un análisis de "observaciones influyentes", ya que es obvio que tiene unos cuantos residuos grandes. Además, con el software actual, es barato estimar una matriz de covarianza robusta de heteroskedasiticidad, y ver si los errores estándar difieren visiblemente o no, si invierten las pruebas de sigificancia estadística o no, etc.
0 votos
Esto parece un caso difícil: hay una cierta concentración de residuos más grandes alrededor del centro del rango de valores Y predichos, pero no tanto como para que no pueda deberse a una variación aleatoria. Un poco más de detalle podría ser útil. ¿Cuál es su modelo de predicción? ¿Le preocupa la posible heteroscedasticidad porque puede afectar a la fiabilidad de los errores estándar de las estimaciones de los parámetros de regresión, o quizás por alguna otra razón?
2 votos
¿Has probado una prueba de White para comprobar la heteroscedasticidad?
0 votos
Voto por cerrar esta pregunta como off-topic porque no se trata de economía. En todo caso, esto es sobre el análisis de datos y debe ser migrado a cross.validated.