6 votos

Previsión de la volatilidad con mayor antelación mediante el aprendizaje automático autorregresivo

ARIMA y GARCH son viejos conocidos para predecir las series temporales de volatilidad de los rendimientos de los activos. Estoy al tanto de los documentos que sustituyen ARIMA y GARCH con algoritmos de aprendizaje automático para predecir la volatilidad financiera con mayor precisión, por lo que esta pregunta es una solicitud de referencia para una encuesta de lo que hay:

¿Cómo se comparan los resultados de los siguientes y otros algoritmos de aprendizaje automático, así como de GARCH, a la hora de predecir la volatilidad para horizontes más largos que un día o un paso por delante?

  • bosque aleatorio
  • regresión de vectores de apoyo (SVR)
  • refuerzo del gradiente
  • K vecinos más cercanos, etc.)

¿Y los aprendices de máquina también se implementan en una fórmula autorregresiva como GARCH (es decir, utilizan las observaciones de volatilidad históricas anteriores para estimar la volatilidad actual)?

Asimismo, ¿qué dicen los artículos de investigación sobre la razón teórica para aplicar el aprendizaje automático a las series temporales de volatilidad en particular?

3voto

AusTravel Puntos 6

Sólo basándome en mi comprensión de los modelos ML en sí, me cuesta creer que KNN o RF sean útiles de alguna manera. No serían los primeros modelos que probaría y tienden a ser sólo modelos ML enseñados en clase por quién sabe qué razón honestamente - ¿quizás porque son fáciles de entender? Por lo que he leído sobre ML en general (no en relación con las series temporales), todos los que has enumerado han sido superados por las redes neuronales. El refuerzo de gradiente podría ser uno de los que todavía es algo útil.

KNN busca predecir un valor basado en K observaciones que son más similares y luego toma el promedio. ¿Cree que la volatilidad de mañana es realmente igual a los días más similares de su conjunto de datos, incluso si los días son de hace 3 años? Si es así KNN, puede ser útil.

RF es una versión menos buena de Gradient Boosting Trees. Predice basándose en los umbrales de las características y, como resultado, sólo divide los datos y luego predice basándose en la media de la media de muchos árboles. Así que la volatilidad de mañana es igual a los días en que el vol de ayer es mayor que x pero menor que y, el snp se movió más que z pero menos que a, etc... ¿Tiene sentido? Tal vez, pero debido a la naturaleza de partición de la RF, nunca puede replicar verdaderamente ninguna función matemática. Es decir, si la verdadera relación entre x e y es lineal, una regresión lineal siempre lo hará mejor que un bosque aleatorio.

2voto

Daniel Puntos 45

Esto depende en gran medida de su configuración y de las características disponibles.

Se puede incluir más información en los algoritmos de clasificación o regresión proporcionando al modelo características adicionales como los rendimientos diarios, semanales, mensuales de períodos anteriores y, eventualmente, también utilizarlos para crear más características como medidas de volatilidad, reversión de la media u otros aspectos que se incluirían en un enfoque "tradicional".

Las ventajas de los algoritmos de aprendizaje automático (especialmente las redes neuronales, como las LSTM u otras RNN) son que suelen ser muy rápidos y ofrecen un rendimiento comparable al de muchos modelos sofisticados de valoración de opciones.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X