5 votos

Aclaración sobre la derivación del lema de Ito

El enfoque clásico para derivar el Lemma de Ito es suponer que tenemos alguna función suave $f(x,t)$ que es al menos dos veces diferenciable en el primer argumento y continuamente diferenciable en el segundo. A continuación, realizamos una expansión en serie de Taylor de la siguiente manera: $$df = \frac{\partial f}{\partial t} dt + \frac{\partial f}{\partial x} dx + \frac{1}{2} \frac{\partial^2 f}{\partial t^2} dt^2 + \frac{1}{2} \frac{\partial^2 f}{\partial x^2} dx^2 + \frac{\partial^2 f}{\partial t \partial x} dt dx + \ldots $$

A continuación, sustituimos $x=X_t$ donde $X_t$ es un proceso estocástico como un proceso Ito: $$dX_t = \mu dt + \sigma dW_t$$ donde $W_t$ es un proceso de Wiener. Al darse cuenta de que $dX_t^2 = dt$ obtenemos la fórmula de Ito.

Tengo varias preguntas sobre este procedimiento:

  1. Cómo debemos interpretar los diferenciales de los términos estocásticos, por ejemplo $dW_t$ o derivadas con respecto a procesos estocásticos como $\frac{\partial}{\partial X_t}$ que aparecen en la expansión de la serie de Taylor cuando sustituimos $x=X_t$ . Esto parece ser indefinido ya que no es una función suave
  2. Me confunde lo que queremos decir cuando decimos $f$ ¿es suave si es una función de un proceso estocástico? Entiendo que es continuamente diferenciable en términos de sus argumentos, pero en cuanto sustituimos $x=X_t$ ¿no se vuelve indiferenciable en el tiempo?
  3. ¿Cómo podemos sustituir $x=X_t$ si $X_t$ es una función de $t$ ? ¿No sería necesario definir la derivada temporal de $X_t$ que por definición es indiferenciable? Esta es la misma discusión que: https://math.stackexchange.com/questions/2252734/confusion-about-second-partial-derivative-term-in-itos-lemma-with-a-constraint

Entiendo que estamos tomando la serie Taylor de $f$ (alguna función ordinaria) y que no tiene nada que ver con $X_t$ . Pero tratar el argumento como $x$ y luego sustituirlo por un argumento dependiente del tiempo $X_t$ parece poco intuitivo. Sin embargo, entiendo que sustituir $X_t$ es lo mismo que sustituir cualquier proceso dependiente del tiempo, independientemente de que sea indiferenciable o no en términos de tiempo. Simplemente parece que cuando sustituimos $x=X_t$ la serie Taylor tiene un poco menos de sentido.

Editar: $d W_t^2 = dt$ no $d X_t^2 = dt$

14voto

drN Puntos 571

Sólo algunas notas

  • Cómo dar sentido a $\text dW_t$ es todo el punto de cálculo estocástico . Está mucho más allá del alcance de cualquier respuesta aquí. Deberías leer algunas notas/libros de introducción al cálculo estocástico. Podrías empezar aquí .

    • La idea: Integrales de Riemann-Stieltjes son de la forma $\int_0^t f(s)\mathrm{d}g(s)$ y están bien definidos si $f$ es continua y $g$ tiene una variación limitada, véase también esta respuesta . Movimiento browniano no tiene variación finita. Pero el movimiento browniano tiene una variación finita cuadrático variación . Así, definimos una nueva integral, $I_t=\int_0^t X_s\text{d}W_s$ que converge en una media cuadrática (más débil) ( $L^2$ ). La construcción sigue siendo la misma: definir esta integral para las funciones escalonadas (que toman valores aleatorios sobre ciertos intervalos) y aproximar cualquier proceso bien comportado $X_t$ por estas funciones escalonadas. El resultado es la integral de Itô. Una propiedad clave es que es una martingala (por ejemplo $\text{d}I_t=X_t\text{d}W_t$ está sin rumbo). He omitido muchos tecnicismos, por supuesto.
  • En el caso más sencillo, la función $f$ tiene que ser suave. Son posibles condiciones más débiles, véase esta respuesta . Puede tomar funciones como $f(x)=x^2$ , $f(t,x)=tx$ o, de hecho $f(t,x_1,...,x_n)$ . Se trata de funciones "estándar". A continuación, se consideran procesos como $f(X_t)=X_t^2$ o $f(X_t)=tX_t$ taponando mecánicamente el proceso $X_t$ para la variable $x$ .

    • Es un poco como el álgebra y los polinomios: Tienes alguna regla general $p(X)=X+X^2$ y puedes introducir elementos de tu anillo/campo (números) o, por ejemplo, objetos más sofisticados como matrices y otros mapas lineales.
    • Todo el sentido del Lemma de Itô es que si se conoce el proceso $X_t$ pero están interesados en un proceso $f(X_t)$ Por ejemplo, usted tiene un modelo para las variantes $v_t$ pero te interesan las volatilidades $\sqrt{v_t}$ o conoce un modelo para el precio de las acciones $S_t$ pero están interesados en la dinámica de los precios de los futuros. El lema de Itô es, pues, una versión estocástica de la regla de la cadena.
  • $\text dX_t^2\neq \text dt$ . En su lugar, $\text dW_t^2=\text dt$ y $\text dX_t^2 = \sigma^2(t,X_t)\text dt$

  • Derivados como $W'(t)=\lim\limits_{h\to0}\frac{W_{t+h}-W_t}{h}$ no existen, véase aquí . Las trayectorias de las muestras del movimiento browniano son continuas pero no diferenciables en ninguna parte. Algo así como $\frac{\partial}{\partial W_t}$ no tiene sentido. De hecho, el término `` $\text{d}W_t$ '' técnicamente no tiene sentido como diferencial y es sólo una notación abreviada para una integral, $\text{d}X_t=\sigma_t\text{d}W_t$ realmente sólo significa $X_t=X_0+\int_0^t\sigma_s\text{d}W_s$ . La notación diferencial es simplemente más corta y práctica.

Demostración heurística del lema de Itô

Considere una función $f(t,x)$ y un proceso Itô $\text{d}X_t=\mu(t,X_t)\text{d}t+\sigma(t,X_t)\text{d}W_t$ . Taylor nos dice \begin{align*} \text df(t,x) = f_t(t,x)\text dt+f_x(t,x)\text dx+\frac{1}{2}f_{tt}(t,x)\text dt^2+f_{tx}(t,x)\text dx\text dt+\frac{1}{2}f_{xx}(t,x)\text dx^2, \end{align*} donde los subíndices se refieren a las derivadas parciales. Ahora, introducimos mecánicamente $X_t$ para $x$ y obtener \begin{align*} \text df(t,X_t) = f_t(t,X_t)\text dt+f_x(t,X_t)\text dX_t+\frac{1}{2}f_{tt}(t,X_t)\text dt^2+f_{tx}(t,X_t)\text dX_t\text dt+\frac{1}{2}f_{xx}(t,X_t)\text dX_t^2 \end{align*} Como $\text dt\to0$ podemos ignorar $\text dt^2$ . En términos de magnitud, $\text{d}X_t\sim\sqrt{\text{d}t}$ y $\text{d}X_t^2\sim\text{d}t$ . Por lo tanto, podemos ignorar $\text dX_t\text dt\sim \text{d}t^{3/2}$ pero no podemos ignorar $\text dX_t^2$ que es de orden $\text{d}t$ ¡! Esta es la gran diferencia entre el cálculo estocástico y el cálculo real ordinario, para el que podemos ignorar estos términos. Así, \begin{align*} \text df(t,X_t) &= f_t(t,X_t)\text dt+f_x(t,x)\text dX_t+\frac{1}{2}f_{xx}(t,X_t)\sigma^2(t,X_t)\text dt \\ &= \left( f_t(t,X_t)+f_x(t,X_t)\mu(t,X_t)+\frac{1}{2}f_{xx}(t,X_t)\sigma^2(t,X_t)\right)\text{d}t+f_x(t,X_t)\sigma(t,X_t)\text{d}W_t, \end{align*} que es la fórmula estándar que se ve en los libros de texto y en wikipedia .

Ejemplo del lema de Itô

Queremos calcular $\int_0^t W_s\text{d}W_s$ . Resulta que una forma inteligente es estudiar $f(t,x)=x^2$ con $\mu(t,X_t)=0$ y $\sigma(t,X_t)=1$ es decir $X_t=W_t$ es un movimiento browniano estándar. Entonces, \begin{align*} \text dW_t^2&=\left(0+0+\frac{1}{2}\cdot1\cdot2\right)\text{d}t+2W_t\text{d}W_t \\ \implies \int_0^t W_s\text{d}W_s&=\frac{1}{2}W_t^2-\frac{1}{2}t \end{align*}

La diferencia clave con el cálculo ``ordinario'', es decir $\int x\text{d}x=\frac{1}{2}x^2$ es el término $-\frac{1}{2}t$ en la integral de Itô. Viene del mero hecho de que no se pueden ignorar términos como $\text{d}X_t^2$ para los procesos estocásticos (que tienen una variación cuadrática no nula). De hecho, se deriva de la $\frac{1}{2}f_{xx}(t,X_t)\sigma^2(t,X_t)\text{d}t$ parte.

Enchufar $X_t$ para $x$

Este punto es simple pero sutil. Se debe principalmente a la notación. Consideremos $f(x)=x^2$ . Esta función toma algunos datos de entrada ( $x$ ) y le da alguna salida ( $x^2$ ). Se puede sustituir por cualquier cosa para la variable (marcador de posición) $x$ para los que se pueden definir potencias. Por ejemplo,

  • si $(a_n)$ es una secuencia de números reales, entonces $f(a_n)=a_n^2$ es una nueva secuencia de números
  • si $x$ es un número real, entonces $f(x)=x^2$ es otro número real
  • si $A\in K^{n\times n}$ es una matriz cuadrada, entonces $f(A)=A^2$ es otra matriz cuadrada
  • si $(X_t)_{t\geq0}$ es un proceso estocástico, entonces $f(X_t)=X_t^2$ es otro proceso estocástico

Supongamos que $r_t$ es un proceso para la tasa corta. Por ejemplo, Vasicek propone $\text{d}r_t=\kappa(\theta-r_t)\text{d}t+\sigma\text{d}W_t$ . El precio de un bono de cupón cero es $e^{A(\tau)+r_tB(\tau)}$ para algunas funciones $A,B$ . Ahora podría interesarle conocer la dinámica del precio del bono, $\text{d}P$ . Por lo tanto, se utilizaría la función $f(t,x)=e^{A+xB}$ que, cuando se conecta $r_t$ para $x$ te da el precio del bono.

Es confuso porque a menudo es conveniente ser un poco descuidado con la notación. A menudo se ve la solución de Black-Scholes escrita como $V(t,S_t)=S_t\Phi(d_1)-Ke^{-rT}\Phi(d_2)$ donde $$\frac{\partial V}{\partial t}+(r-\delta) S_t\frac{\partial V}{\partial S_t}+\frac{1}{2}\sigma^2S_t^2\frac{\partial^2 V}{\partial S_t^2}-rV=0$$ que, sin embargo, no tiene sentido. Técnicamente se debería escribir algo así como que el precio de la opción de compra es $V(t,S_t)$ donde $V(t,x)=x\Phi(d_1)+Ke^{-rT}\Phi(d_2)$ . La función $V$ satisface $$\frac{\partial V}{\partial t}+(r-\delta) x\frac{\partial V}{\partial x}+\frac{1}{2}\sigma^2x^2\frac{\partial^2 V}{\partial x^2}-rV=0.$$ La diferencia es que $V(t,x)$ es una función ``normal'' que se puede diferenciar con respecto a $x$ . Una expresión como $\frac{\partial V}{\partial S_t}$ no tiene ningún sentido. A menudo, es conveniente utilizar esta notación abreviada si su público sabe lo que quiere decir, pero debe ser terriblemente confuso para los estudiantes que empiezan a aprender sobre finanzas.

Al derivar el Lemma de Itô, se comienza con la expansión de Taylor de la función $f(t,x)$ . En esta etapa, $f$ es una función arbitraria (de valor real). Después de calcular las derivadas parciales de $f$ se puede introducir simplemente el proceso estocástico $X_t$ para la variable $x$ . Recuerde: la variable $x$ es sólo un marcador de posición para algo otra cosa (en nuestro caso: un proceso estocástico).

1voto

AlejandroVD Puntos 18

Desde un punto de vista heurístico pero muy poco riguroso, en el mundo real tenemos procesos continuos que son aleatorios (o imprevisibles). Por lo tanto, queremos desarrollar un proceso para desarrollar una forma de describirlo. El pan de cada día de las variables aleatorias continuas es una distribución normal. Es natural que intentemos enmarcar un proceso aleatorio basado en la distribución normal.

Una de las muchas formas de hacerlo es el proceso de Wiener, que tiene varias propiedades. Podría decirse que una de las propiedades más importantes es que $W(t+s)-W(t) \sim N(0,s)$ .

Es natural estudiar cuando $s \to 0$ , cuál será el comportamiento del proceso. Por sí solo no es demasiado interesante. Por sí solo es casi seguramente 0. Lo que es más interesante es que si hay infinitas sumando. Lo que es aún más interesante es si aplicamos un peso diferente para cada una de estas pequeñas variables aleatorias diferentes. Es bastante similar a cómo integramos una función conocida, es estocástico. Así que lo llamamos cálculo estocástico.

Los pequeños cambios aleatorios que comienzan en $t$ puede verse como $dW(t)$

No es demasiado saludable ver los pequeños cambios en el sentido de la diferenciación. Es mejor verlo en el sentido de los pequeños cambios o, lo que es lo mismo, en el sentido de la integración

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X