15 votos

Regresión de series temporales con datos superpuestos

Estoy viendo un modelo de regresión que hace una regresión de los rendimientos interanuales de los índices bursátiles sobre los rendimientos interanuales rezagados (12 meses) del mismo índice bursátil, el diferencial de crédito (diferencia entre la media mensual de los bonos libres de riesgo y los rendimientos de los bonos corporativos), la tasa de inflación interanual y el índice interanual de producción industrial.

Parece que es así (aunque en este caso sustituirías los datos específicos de la India):

SP500YOY(T) = a + b1*SP500YOY(T-12) + b2*CREDITSPREAD(T) 
                + b4*INDUSTRIALPRODUCTION(T+2) + b3*INFLATION(T+2)
                + b4*INFLATIONASYMM(T+2)

SP500YOY es la rentabilidad interanual del índice S&P500 Para calcularla, se calcula la media mensual de los valores del S&P500 y se convierte en rentabilidad interanual para cada mes (es decir, enero-10-enero-11, febrero-10-febrero-11, marzo-10-marzo-11 ). Por lo que respecta a las variables explicativas, se utiliza un valor retardado de 12 meses de la SP500YOY se utiliza junto con el CREDITSPREAD en el momento T y INFLATION y INDUSTRIALPRODUCTION dos periodos adelante. El INFLATIONASYMM es una variable ficticia que indica si la inflación está por encima de un valor umbral del 5,0%. El índice entre paréntesis muestra el índice temporal de cada variable.

Se estima mediante una regresión lineal OLS estándar. Para utilizar este modelo en la previsión de los rendimientos YOY del S&P500 a 1, 2 y 3 meses vista, hay que generar previsiones a 3, 4 y 5 meses vista para la inflación y el índice de producción industrial. Estas previsiones se realizan tras ajustar un modelo ARIMA a cada uno de los dos por separado. Las previsiones de CreditSpread para los próximos 1, 2 y 3 meses se incluyen simplemente como estimaciones mentales.

Me gustaría saber si esta regresión lineal OLS es correcta/incorrecta, eficiente/ineficiente o una práctica estadística generalmente válida.

El primer problema que veo es el de la utilización de datos superpuestos. Es decir, los valores diarios del índice bursátil se promedian cada mes, y luego se utilizan para calcular los rendimientos anuales que se renuevan mensualmente. Esto debería hacer que el término de error esté autocorrelacionado. Creo que habría que utilizar alguna "corrección" del tipo de las siguientes:

  • Estimador de covarianza consistente con la heteroscedasticidad de White
  • Estimador de heteroscedasticidad y autocorrelación consistente (HAC) de Newey & West
  • versión coherente con la heteroscedasticidad de Hansen y Hodrick

¿Tiene realmente sentido aplicar la regresión lineal OLS estándar (sin ninguna corrección) a estos datos superpuestos, y más aún, utilizar previsiones ARIMA de 3 periodos por delante para las variables explicativas a utilizar en la regresión lineal OLS original para la previsión SP500YOY ? No he visto antes un formulario de este tipo, y por lo tanto no puedo juzgarlo realmente, sin la excepción de corregir el uso de observaciones superpuestas.

7voto

Chris Bunch Puntos 639

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X