1 votos

¿Optimizan los modelos en series temporales con bootstrap?

Como Quants, pronto aprendemos a optimizar los modelos, ajustándolos a series temporales históricas, por ejemplo, los rendimientos diarios históricos de algunas acciones.

Pero la serie histórica de rendimientos diarios es sólo una realización, entre muchas series posibles que podrían originarse a partir de la misma distribución de rendimientos diarios.

Por lo tanto, si ajusto mi modelo a una realización específica de rendimientos diarios -que resulta ser la serie histórica- podría estar sobreajustando el modelo.

¿No sería más correcto optimizar el modelo, basándose en N boostrapped serie de rendimientos diarios, todos ellos procedentes de la serie histórica real?

¿Dónde se situaría esta técnica, en el espectro que va desde estúpido a estándar de la industria ?

5voto

Brownie Puntos 151

La simulación de datos de series temporales no es un asunto trivial y hay una serie de métodos para asegurarse de que se conservan algunas de las propiedades relevantes (en su mayoría llamadas dependiente métodos bootstrap):

  • Bloque de arranque - bloques contiguos de datos elegidos de forma que sean lo suficientemente grandes como para conservar autocorrelaciones significativas.
  • Arranque estacionario - tamaño de bloque aleatorio
  • Modelo basado en el bootstrap - modelo de ajuste (por ejemplo, ARIMA) y los residuos de bootstrap (IID es teóricamente correcto).
  • Monte Carlo - ajustar el modelo y simular a partir de la distribución teórica para los residuos.
  • GAN condicional - condicionar los datos de las series temporales relevantes y generar datos que desafíen un discriminador adecuado.

Muchos de estos métodos se utilizan para generar las estadísticas necesarias para probar si una de las muchas estrategias posibles tiene una rentabilidad/espectro/otra medida de rendimiento estadísticamente significativa. La prueba Reality Check de White y sus muchas variantes (de Romano-Wolf y de Hansen et al-Model Confidence sets) prueban entre muchos modelos utilizando este marco de pruebas de hipótesis múltiples. Se trata de un tipo de selección de modelos y tiene un gran parecido con el ajuste de hiperparámetros. En nuestro trabajo GAN para estrategias de negociación En este sentido, tratamos de hacer una revisión bibliográfica relativamente exhaustiva y de utilizar los cGANs para generar más datos para su puesta a punto. Descubrimos que, en general, los métodos de combinación/conjunto de modelos funcionan mejor.

En cualquier caso, la idea de generar nuevos datos para obtener predictores más robustos o un mejor rendimiento fuera de la muestra es bastante razonable.

0voto

Ali Butt Puntos 11

Es una técnica útil, pero más para estimar el riesgo que la rentabilidad. Creo que Markowitz trabajaba generando simulaciones de mercados enteros hasta llegar a los participantes individuales del mercado para tener una mejor idea de las dislocaciones del mercado. Si se utiliza Ledoit-Wolf para la contracción de la covarianza, puede implicar la simulación bootstrap de series de IC de factores a partir de matrices de covarianza de muestras aleatorias.

El problema de utilizarlo para optimizar los modelos de alfa es que vas a utilizar algún modelo semideterminista de los rendimientos de las acciones para generar tus series de rendimientos. Si luego intentas calcular un modelo para predecir esos rendimientos, lo mejor que puedes hacer es descubrir tu modelo semideterminista, que es una aproximación y no el mercado real.

0 votos

¡gracias @DoctorOrrey! Estoy de acuerdo con esa debilidad, si generas series de retorno a partir de un modelo semideterminista. Pero eso sería análisis Montecarlo, más que boostrapping, porque generas retornos a partir del modelo, no los muestreas a partir de la serie histórica.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X