2 votos

Calibración profunda vs "superficial" de modelos de fijación de precios de opciones

Actualmente estoy investigando la aplicación del aprendizaje profundo en la calibración de modelos de precios de opciones, específicamente, modelos de volatilidad áspera, como rBergomi. Si bien hay mucha investigación sobre el uso de redes neuronales profundas como motores de precios de opciones rápidos con parámetros de mercado y modelo como características de entrada, parece que prácticamente no hay nada sobre el uso de aumento de gradiente para aproximar la función de precios en algún modelo de fijación de precios de opciones. Dado que el aumento de gradiente suele superar al aprendizaje profundo en datos tabulares, ¿por qué se concentra la investigación en la calibración profunda?

2voto

John Rennie Puntos 6821

Hay una diferencia entre

  1. "precio rápido" que imita la función que mapea las características de los observables (lo que llamas datos de mercado y parámetros en tu pregunta) al valor de un contrato derivado que ya ha sido calculado (pero de una manera lenta)
  2. "precio profundo" que calcula el valor y la estrategia de cobertura óptima de un reclamo contingente.

El hecho de que el segundo se llame "profundo" es compatible con tu pregunta: se usan redes neuronales profundas para eso, mientras que para el primero (aprender un mapeo) se usan muchas otras opciones.

Para el precio rápido también se utilizan métodos de impulso. Vea, por ejemplo

El precio rápido se trata de usar una base de datos de simulación numérica lenta sobre un conjunto $\Omega$ de ejemplos de mapeos $X\in \Omega\mapsto Y=\mathbb{E}(\mbox{payoff})$.

La ventaja es que si has realizado simulaciones para dos ejemplos $X_1$ y $X_2$ y te enfrentas en tiempo real a una nueva configuración $X_{new}$ que no es "demasiado diferente" de ellos, el aprendizaje automático también interpolará y dará rápidamente un resultado.

El precio profundo es diferente: quieres resolver el HJB que caracteriza el reclamo; está compuesto por dos componentes: el valor del reclamo (que es lo que interpolarás más tarde con precio rápido) y el control óptimo que es la cartera de cobertura que replica la exposición del reclamo.

Comúnmente se denomina el método de Howard (o iteración de políticas y valores). Cuando se utiliza el aprendizaje automático se deben utilizar dos algoritmos:

  • uno para emular el control óptimo, resolviendo la parte óptima del HJB
  • y una vez que el control está establecido, el HJB se reduce a una EDP para una función de valor, que necesitas emular usando otra red neuronal.

Globalmente, cuando utilizas este proceso, debes hacer que converjan simultáneamente 2 redes neuronales. Y en cierto sentido es como una "red neuronal global" más grande, funciona bastante bien. Las personas que probaron otros algoritmos (como boosting) no obtuvieron (en mi conocimiento) buenos resultados porque tienes que controlar simultáneamente la convergencia de los dos algoritmos. Para las redes neuronales no es tan difícil (puedes sincronizar sus tasas de aprendizaje). De alguna manera se asemeja al Q-learning del Aprendizaje por Refuerzo.

Una forma de entender este efecto es mirar lo que sucede cuando introduces otra convergencia: cuando quieres resolver un Juego de Campo Medio de controladores estocásticos. Imagina que quieres que tu proceso de cobertura tenga en cuenta el hecho de que otros bancos están cubriendo productos similares y que todas las operaciones de cobertura crean un acoplamiento a través del impacto en el mercado. Recientemente Angiuli, Andrea, Jean-Pierre Fouque y Mathieu Laurière. "Unified reinforcement Q-learning for mean field game and control problems" Mathematics of Control, Signals, and Systems 34, núm. 2 (2022): 217-271. Si te interesa este tipo de pregunta, te recomiendo Capponi, Agostino, y C.-A. L, eds. Machine Learning and Data Sciences for Financial Markets: A Guide to Contemporary Practices. Cambridge University Press, 2023. Hay una parte completa: Nuevas Fronteras para el Control Estocástico en Finanzas con 6 capítulos al respecto.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X