¿Podría explicarme con palabras (sin fórmulas) el concepto del método Least Squares Monte Carlo para fijar el precio de una opción estilo americano?
Respuesta
¿Demasiados anuncios?Para calcular el precio de una opción americana o de un instrumento con opción de compra en general, en cada fecha de ejercicio potencial, hay que comparar su valor de continuación (expectativa neutral al riesgo descontada de lo que pagaría la opción si no se ejerciera) con el correspondiente valor de ejercicio/precio de reembolso anticipado.
Por construcción, los métodos de celosía y de diferencias finitas permiten un cálculo directo de los primeros valores de continuación, ya que trabajan por inducción hacia atrás (partiendo de la condición terminal al vencimiento y trabajando hacia atrás hasta el inicio calculando las expectativas neutrales al riesgo). Sin embargo, estos métodos sufren la maldición de la dimensionalidad (la carga computacional aumenta rápidamente con el número de activos subyacentes).
En el otro extremo del espectro, el método estándar de Monte Carlo es de naturaleza directa: se simulan realizaciones del proceso de precios subyacentes bajo la medida de riesgo neutral, se aplica la función de pago y se toma la expectativa descontada de los pagos de esas trayectorias para obtener el precio de la opción. Por lo tanto, el cálculo de los valores de continuación en momentos futuros es menos sencillo. Se podría hacer con simulaciones anidadas, pero esto no sería práctico.
Una alternativa, propuesta por primera vez por Longstaff y Schwartz en un célebre artículo, consiste en simular las trayectorias y, a continuación, trabajar hacia atrás en el tiempo para estimar los valores de continuación mediante una regresión por mínimos cuadrados sobre un conjunto de las denominadas funciones base. En cada paso de tiempo, se actualizan los pagos de las trayectorias comparando los valores de continuación estimados con los valores del ejercicio y repitiendo la operación. El método tiene algunos sesgos conocidos cuando se utiliza un número finito de simulaciones y funciones de base, pero se demuestra que converge en caso contrario.
Más información sobre el paso de regresión como se pide en los comentarios.
En un problema de regresión, nos enfrentamos a un conjunto de datos ruidosos y nos preguntamos qué proceso podría haber generado estos datos. En su forma más simple, se podría ver este proceso de generación de datos como una caja negra, que toma algunas entradas xx y la generación de resultados y=f(x)+ϵy=f(x)+ϵ donde ϵϵ es un término de ruido de media cero. Su objetivo es entonces estimar f(x)=E[y|x]
Evidentemente, hay muchas maneras de enfocar el problema. Una de las más intuitivas ("modelización discriminativa") es suponer una forma paramétrica f(x)=∑Ni=1αiϕi(x) donde se decide de la ϕi(x) (funciones base) y el problema se reduce entonces a estimar la αi que mejor fit los datos. Esto se denomina modelización discriminativa (frente a la modelización generativa).
Ahora te puedes hacer la pregunta, ¿cuál es el verdadero f(x) de la DGP fue f(x)=sin(x) y sólo he seleccionado una función base ϕ1(x)=x . Seguramente en ese caso nunca tendré una buena estimación de f(x) Por eso es importante la elección de las funciones de base: lo ideal es que permitan representar un amplio conjunto de funciones (noción de conjunto completo).
¿Qué relación tiene esto con el problema que nos ocupa? El precio de un derivado en t (que se busca) es la expectativa de su valor descontado a t+δ condicionada a toda la información que tiene en t matemáticamente: Vt=E[P(t,t+δ)Vt+δ|Ft]
Esto es de la misma forma que el problema anterior: se observa P(t,t+δ)Vt+δ con la condición de Ft (simulado mediante MC) y se busca la función generadora de datos Vt . Más concretamente, si se asume que "toda la información disponible" en t se reduce al conocimiento del precio actual al contado St se obtiene el siguiente problema Vt=f(St)=E[P(t,t+δ)Vt+δ|St] similar a f(x)=E[y|x] Ahora de nuevo el hecho de elegir representar toda la información disponible en t ( Ft ) sólo con el conocimiento de St (así que, básicamente, la elección del regresor además de la elección de las funciones de base), podría ser una suposición demasiado estricta en algunos casos.
3 votos
Debería leer el documento de Longstaff-Schwartz que puede encontrar aquí, por ejemplo google.com/url?sa=t&source=web&rct=j&url=https://
1 votos
Aquí hay una implementación en python del ejemplo de Longstaff-Schwartz, tal vez ayude a dar una mejor imagen de lo que hacen: gist.github.com/charelF/755a339f5754121fc22ad81d8196e615