Estoy realizando un análisis de series temporales. Mi variable dependiente es la desigualdad de ingresos, que ha sido registrada y luego diferenciada. En otras palabras, mi variable Y es ahora la diferencia en el logaritmo de la desigualdad de ingresos.
La variable independiente de interés para este estudio es el precio de la vivienda, que se ha transformado de la misma manera. La principal variable X es la diferencia de los precios logarítmicos de la vivienda.
La transformación logarítmica y por diferencia de estas dos variables (y de la mayoría de las demás) las ha hecho estacionarias. Esto se comprueba trazando la variable y realizando una prueba de Dickey-Fuller aumentada tanto antes como después.
Además, estoy considerando la autocorrelación de las variables a lo largo del tiempo trazando la correlación de los rezagos y viendo si están dentro de un nivel de significación predeterminado. Las transformaciones resuelven principalmente una autocorrelación en el tiempo.
Sin embargo, para una de las variables de control, tomar la diferencia del logaritmo no la hace estacionaria. Se trata de la variable de control de la Dependencia de la Edad, que es la proporción de mayores de 65 años y menores de 15 en comparación con el resto de la población. Se ha demostrado que es un determinante de la desigualdad de ingresos en la literatura anterior.
Cuando realizo una prueba de Dicky-Fuller aumentada de la diferencia en la tasa de dependencia de la edad logarítmica, es estadísticamente insignificante. Además, el gráfico sigue teniendo claramente una tendencia, como se muestra a continuación:
Cuando tomo la diferencia de la diferencia de la dependencia de la edad logarítmica, es estacionaria.
Mi pregunta es ¿cuál es la mejor manera de proceder ahora? Creo que no puedo incluir una variable de control en la regresión que es claramente no estacionaria (es decir, diferenciada una vez).
Sin embargo, también tengo entendido que no puedo incluir dos variables diferentes que estén integradas en órdenes diferentes. Esto significaría que, dado que la mayoría de las variables sólo se diferencian una vez y esta variable se diferencia dos veces, los resultados de la regresión estarían sesgados si se incluyeran ambas.
Además, no puedo eliminar la variable porque se ha demostrado que es un predictor de la desigualdad de ingresos.
Se agradecería cualquier orientación sobre esta cuestión. En el mejor de los casos, si pudieras indicarme la dirección de cualquier literatura que apoye lo que es la mejor práctica económica, sería estupendo.
Por favor, hágame saber si necesita cualquier información adicional.