1 votos

¿La diferencia de una diferencia para una variable de control en una regresión?

Estoy realizando un análisis de series temporales. Mi variable dependiente es la desigualdad de ingresos, que ha sido registrada y luego diferenciada. En otras palabras, mi variable Y es ahora la diferencia en el logaritmo de la desigualdad de ingresos.

La variable independiente de interés para este estudio es el precio de la vivienda, que se ha transformado de la misma manera. La principal variable X es la diferencia de los precios logarítmicos de la vivienda.

La transformación logarítmica y por diferencia de estas dos variables (y de la mayoría de las demás) las ha hecho estacionarias. Esto se comprueba trazando la variable y realizando una prueba de Dickey-Fuller aumentada tanto antes como después.

Además, estoy considerando la autocorrelación de las variables a lo largo del tiempo trazando la correlación de los rezagos y viendo si están dentro de un nivel de significación predeterminado. Las transformaciones resuelven principalmente una autocorrelación en el tiempo.

Sin embargo, para una de las variables de control, tomar la diferencia del logaritmo no la hace estacionaria. Se trata de la variable de control de la Dependencia de la Edad, que es la proporción de mayores de 65 años y menores de 15 en comparación con el resto de la población. Se ha demostrado que es un determinante de la desigualdad de ingresos en la literatura anterior.

Cuando realizo una prueba de Dicky-Fuller aumentada de la diferencia en la tasa de dependencia de la edad logarítmica, es estadísticamente insignificante. Además, el gráfico sigue teniendo claramente una tendencia, como se muestra a continuación:

Difference of log age dependency tracked over time

Cuando tomo la diferencia de la diferencia de la dependencia de la edad logarítmica, es estacionaria.

Mi pregunta es ¿cuál es la mejor manera de proceder ahora? Creo que no puedo incluir una variable de control en la regresión que es claramente no estacionaria (es decir, diferenciada una vez).

Sin embargo, también tengo entendido que no puedo incluir dos variables diferentes que estén integradas en órdenes diferentes. Esto significaría que, dado que la mayoría de las variables sólo se diferencian una vez y esta variable se diferencia dos veces, los resultados de la regresión estarían sesgados si se incluyeran ambas.

Además, no puedo eliminar la variable porque se ha demostrado que es un predictor de la desigualdad de ingresos.

Se agradecería cualquier orientación sobre esta cuestión. En el mejor de los casos, si pudieras indicarme la dirección de cualquier literatura que apoye lo que es la mejor práctica económica, sería estupendo.

Por favor, hágame saber si necesita cualquier información adicional.

0voto

Matthias Benkard Puntos 11264

Mi pregunta es ¿cuál es la mejor manera de proceder ahora? Creo que no puedo incluir una variable de control en la regresión que es claramente no estacionaria (es decir, diferenciada una vez).

Esto es correcto cuando hablamos de regresión estándar. Por supuesto, hay algunos modelos que permiten variables no estacionarias si hay cointegración, pero hay que hacer más pruebas para ello y, además, hay que tener alguna razón para creer que hay alguna relación de equilibrio a largo plazo entre las variables cointegradas.

Sin embargo, también tengo entendido que no puedo incluir dos variables diferentes que estén integradas en órdenes diferentes. Esto significaría que, como la mayoría de las variables sólo se diferencian una vez y esta variable se diferencia dos veces, los resultados de la regresión estarían sesgados si se incluyeran ambas.

No, esto no es correcto. Una vez que se diferencia la variable se cambia su orden de integración. La variable dos veces diferenciada que era originalmente I(2) será ahora I(0) de la misma manera que la variable una vez diferenciada que era I(1) será I(0). Mientras todas las variables (después de las transformaciones) sean I(0) no hay problema en tenerlas juntas en la regresión de series de tiempo regulares.

Más bien el problema es que ahora has cambiado significativamente el significado de la regresión. Ya no está controlando la dependencia de la edad, ni el cambio en la dependencia de la edad, sino la aceleración del cambio en la dependencia de la edad. Sin embargo, si está de acuerdo con esto, no hay problema en tenerlo en una regresión.

PS:

Parece que sólo tiene 25 observaciones. Debe saber que, como regla general, necesita unas 30 observaciones por regresor independiente para satisfacer las propiedades asintóticas de OLS (véase Verbeek A Guide to Modern Econometrics). Si su regresión tiene un total de 25 observaciones sobre las que ejecuta su MCO, tiene problemas mucho mayores que la simple no estacionariedad. En ese caso, no debería estimar modelos paramétricos en absoluto.

PPS:

Se sabe que la prueba de Dickey-Fuller tiene poca potencia en muestras pequeñas. Es posible que no pueda rechazar la nulidad de no estacionariedad sólo porque tiene $n=25$ . Yo recomendaría volver a probar la variable con alguna prueba alternativa con nulo conmutado. Por ejemplo, la prueba KPSS tendría más sentido cuando su muestra es tan increíblemente pequeña.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X