4 votos

¿Mi instrumento es demasiado ruidoso?

Tengo un instrumento, que quiero utilizar con el IV 2SLS, para predecir mi variable endógena.

El gráfico de dispersión de mi instrumento contra mi variable endógena se ve así.

enter image description here

Utilizando el binscatter de Stata, puedo absorber las variables de control y los efectos fijos, y el gráfico de binscatter resultante tiene este aspecto. En el eje X, todos los puntos de datos se distribuyen a través de 100 contenedores iguales, y el gráfico reporta el valor medio de cada contenedor, para los valores en los ejes X e Y (después de controlar las variables de control y los efectos fijos).

enter image description here

La primera etapa del IV 2SLS es estadísticamente significativa (0,357***, utilizando errores estándar robustos), y la F Stat está por encima del umbral crítico de 10.

Mi pregunta es: ¿el instrumento tiene demasiado ruido? Veo muchos valores atípicos, y no estoy seguro de si el hecho de que obtenga una Primera Etapa positiva y significativa, y F Stats por encima de 10, es un artefacto estadístico. Supongo que me pregunto si la distribución de los datos en mi gráfico de dispersión hace que no sea apropiada para OLS y para estas pruebas de relevancia.

Gracias.

1voto

Matthias Benkard Puntos 11264

Aconsejaría no intentar determinar si algo es atípico o no sólo visualmente. Incluso visualmente diría que sólo hay 2 valores atípicos claros en el primer gráfico y 1 en el segundo. Puedes intentar comprobarlo de forma más rigurosa calculando alguna métrica para la observación del alcance. Por ejemplo, se puede utilizar la puntuación Z, y luego se puede tratar de hacer la comprobación de robustez mediante la eliminación de las observaciones más allá de $\pm 3\sigma$ .

Además, muchos estadísticos desaconsejarían eliminar incluso los valores atípicos genuinos, a menos que se trate de un claro error en la entrada (por ejemplo, la altura de una persona de 1 cm, etc.). Los valores atípicos, si no son resultado de errores, siguen siendo observaciones genuinas que contienen información sobre la verdadera relación.

En cuanto a si los datos son ruidosos o no, eso no depende de los valores atípicos en sí, sino de los errores estándar. Los errores estándar más altos significan más ruido. Sin embargo, no hay ninguna regla general sobre el ruido per se.

Cuando se trata de ruido en los datos la cuestión es que $t$ -se calcula como $\hat{\beta}/se(\hat{\beta})$ (véase Verbeek A Guide to Modern Econometrics). Si hay mucho ruido (se es alto), es más probable que no se rechace la nulidad, aunque quizás haya una relación verdadera que se podría ver en datos menos ruidosos. Sin embargo, tener datos ruidosos no hace que sus instrumentos sean inválidos.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X