1 votos

Variable dependiente retardada, ¿sí o no?

He leído opiniones contradictorias sobre la inclusión de variables dependientes retardadas en la modelización, y supongo que en parte depende del investigador y del alcance y el objetivo de la investigación.

Actualmente estoy modelando la liquidez de las acciones alemanas, con una regresión de datos de panel (efectos temporales fijos), y mis variables independientes son el precio (registrado), el número de acciones freefloat (registrado) y el valor de mercado.

Utilizando E-views, mis resultados son correctos, excepto por un valor de Durbin-Watson en torno a 1,5.

Asumiendo que Durbin Watson es válido para los datos del panel (pero para las acciones separadas, el DW también es demasiado bajo), tenemos autocorrelación en los errores.

Esto es un problema porque:.

(i) Las estimaciones de los coeficientes de regresión son ineficientes. (ii) Las previsiones basadas en las ecuaciones de regresión no son óptimas. (iii) Las pruebas de significación habituales de los coeficientes no son válidas. [fuente: Granger]

Incluir una variable dependiente retardada, es decir, la liquidez del día anterior, resuelve este problema y, como es de esperar, aumenta un poco más la R^2. Pero no estoy muy seguro de que este sea el camino a seguir. Esto es modelar la liquidez donde la liquidez del día anterior es el factor más importante.... Otra opción sería que me falta una variable independiente?

En concreto, los documentos de Achen (¿Retrasarse o no retrasarse? Reevaluación del uso de variables dependientes Dependent Variables in Regression Analysis) y Wilkins (Why Lagged Dependent Variables Can Supress the Explanatory Power of Other Independent Variables) hablan de estas cuestiones.

2voto

Juan Delgado Puntos 190

Excluir un término autorregresivo de una regresión (una regresión de series temporales univariante normal o, como en su caso, una regresión de datos de panel estática) no es un problema de variables omitidas. Para el caso univariante, la mayoría de los libros de texto estándar de estadística dicen que la autocorrelación en los residuos sigue dejando la estimación OLS insesgada y consistente (pero la inferencia será incorrecta), véase, por ejemplo, la página 265 de Greene (2002). Esto también es cierto para los modelos de datos de panel estáticos, véase, por ejemplo, la página 92 de Baltagi (2008). Más técnicamente, dejar fuera el término AR(1) conduce a cov(e_it,e_it-1)≠0 pero no a cov(X_it,e_it)≠0, que es el problema de endogeneidad causado por las variables omitidas.

Lo que debe hacer es permitir la agrupación de los errores estándar dentro de las empresas (a lo largo del tiempo), lo que resolverá su problema de inferencia. La agrupación entre empresas no debería ser un problema, ya que incluye efectos fijos de tiempo, véase Pedersen (2009) para más información sobre el cálculo de los errores estándar en los datos de panel.

Si se incluye la liquidez rezagada, se tendrá un modelo de datos de panel dinámico que tendrá un sesgo de estimación cuando se incluyan efectos fijos de empresa o de tiempo. Este sesgo se denomina sesgo de Nickell en honor a Nickell (1981) y cuando se tienen efectos fijos en el tiempo el sesgo es de magnitud O(1/N). Un aspecto importante a tener en cuenta es que si se opta por un modelo dinámico y se especifica la dinámica de forma incorrecta (digamos que la verdadera estructura de la serie temporal no es un modelo AR(1)), entonces se habrá introducido una fuente adicional de sesgo por la mala especificación dinámica, véase (Lee, 2012).

En resumen: Si se opta por el modelo estático, al menos las estimaciones serán insesgadas pero ineficaces y la inferencia será incorrecta (pero se arregla fácilmente teniendo en cuenta la agrupación).

Referencias

Baltagi, Badi H. (2008). "Análisis econométrico de datos de panel". Cuarta edición, Wiley.

Greene, William (2002). "Econometric Analysis". Sexta edición, Prentice Hall.

Lee, Yoonseok. (2012). "Bias in Dynamic Panel Models under Time Series Misspecification". Journal of Econometrics 169, 54-60.

Nickell, Stephen. "Biases in dynamic models with fixed effects". Econometrica: Journal of the Econometric Society (1981): 1417-1426.

Petersen, Mitchell A. "Estimación de los errores estándar en conjuntos de datos de panel de finanzas: Comparing approaches". Review of financial studies 22.1 (2009): 435-480.

1voto

Urban Puntos 138

Si hay autocorrelación, hay que añadir la variable dependiente retardada. Al no incluirla, su regresión sufre el sesgo de la variable omitida. Usted dice que al hacer esto estará "modelando la liquidez en la que la liquidez del día anterior es el factor más importante", pero dado que su regresión "exige" añadir la LDV (debido a la CA), lo más probable es que la liquidez de este período dependa en gran medida de la liquidez del período anterior.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X