Supongamos que quiero construir una regresión lineal para ver si los retornos de un stock pueden predecir los retornos de otro. Por ejemplo, digamos que quiero ver si el retorno de VIX en el día X es predictivo del retorno de S&P en el día (X + 30). ¿Cómo lo haría?
La forma ingenua sería formar pares (VIX retorno en el día 1, S&P retorno en el día 31), (VIX retorno en el día 2, S&P retorno en el día 32), ..., (VIX retorno en el día N, S&P retorno en el día N + 30), y luego ejecutar una regresión lineal estándar. Una prueba t de los coeficientes diría entonces si el modelo tiene algún poder de predicción real. Pero esto me parece equivocado, ya que mis puntos están autocorrelacionados, y creo que el valor p de mi prueba t subestimaría el verdadero valor p. (Aunque IIRC, el test t sería asintóticamente sin prejuicios? No estoy seguro.)
Entonces, ¿qué debo hacer? Algunos pensamientos al azar que tengo son:
- Tomar un montón de muestras de bootstrap en mis pares de puntos, y usarlas para estimar la distribución empírica de mis coeficientes y valores p. (¿Qué tipo de bootstrap hago? ¿Y debería correr el bootstrap en el coeficiente del modelo, o en el valor p?)
- En lugar de tomar datos de días consecutivos, sólo toma datos de cada día K. Por ejemplo, use (VIX retorno en el día 1, S&P retorno en el día 31), (VIX retorno en el día 11, S&P retorno en el día 41), etc. (Sin embargo, parece que esto haría que el conjunto de datos fuera demasiado pequeño).
¿Alguno de estos pensamientos son válidos? ¿Qué otras sugerencias hay?