La lógica de Bob Jansen es correcta. El problema es el abuso de las ideas y la notación: el símbolo integral del mundo determinista se aplica de forma descuidada a las variables aleatorias. A diferencia de las normales $dt$ que siempre es positivo, $dW_t$ puede ir "hacia atrás". Así, los incrementos de términos como $W_t dW_t$ tienen un primer elemento que sube y baja con el segundo elemento (que puede subir y bajar) y el producto es siempre positivo. Matemáticamente se reduce al hecho de que, si tomas una función de 2 variables en el mundo normal (determinista) y haces una expansión de Taylor, todo de los términos de segundo orden se puede despreciar cuando se trata de integrar la expansión. Pero no si hay un movimiento browniano...
Creo que el problema que se le plantea a todo el mundo es el uso suelto de la $"\int"$ símbolo. Cuando lo explico me robo el símbolo $\oint$ para integrales estocásticas (no hay conexión con una integral de línea determinista).
Simplemente, si $X_t(t,W(t))$ es una función de dos variables (que lo es), y $X_0=X(0)$ podemos resolver para $X_t$ por integración: $X_t=X_0+\int_0^tX_t(t,W(t))$ . Ahora, yo mismo estoy siendo descuidado, ya que no tenemos " $d?.$ " en la integral.
Lo que todo el mundo hace es sustituir los términos relevantes de la expansión de Taylor para que empiece a parecer (y ahora usaré el otro símbolo):
$X_t-X_0=\oint_0^t[\frac{\partial X_t}{\partial t}dt+\frac{\partial X_t}{\partial Wt}dW_t+\frac{1}{2}\frac{\partial^2X_t}{\partial Wt^2}(dW_t)^2]$
Recordemos que la t en el límite de integración es la t "real", y las que están dentro de la integración son todas ficticias (tal vez usando $\tau$ ayudaría aquí).
Aquí es donde se pone bonito. A los matemáticos y a los financieros les encanta la abstracción de cosas como $\frac{\partial^2X_t}{\partial Wt^2}(dW_t)^2$ Mientras que los físicos a menudo miran cosas como esa y dicen "No sé lo que está pasando allí, pero de alguna manera tiene que convertirse en una integral con respecto al tiempo, ya que todo el punto de esto es modelar la evolución del tiempo".
El primer término se realiza, efectivamente, en función del tiempo, por lo que podemos utilizar " $\int$ " en lugar de " $\oint$ " con seguridad.
Pasemos al tercer término. Este término está en el caso estocástico, y no en el determinista, debido a la dinámica de lo que llamamos $dW_t$ . Habríamos tenido $dt^2$ también, pero se dejó de lado. Mientras que una serie de Taylor es trivialmente correcta en su punto de "anclaje", necesitamos potencialmente muchos términos para ajustarse estrechamente más lejos. Sin embargo, si queremos integrar una serie de Taylor en una vecindad muy cercana a su punto de anclaje sólo necesitamos $f(a)$ y la primera derivada $f'(a)$ en el límite. Intuitivamente, sólo necesitamos la pendiente en nuestra aproximación para los pequeños $\Delta 's$ . Imagina un $\Delta=10^{-30}$ Si sumamos (integramos) $10^{30}$ artículos del orden de este tamaño importan. Pero, aunque sumemos $10^{30}$ unidades del orden del cuadrado de aquella, y por tanto de tamaño del orden de $10^{-60}$ se acumulan tan lentamente que son completamente insignificantes. Este es simplemente el concepto de orden habitual, y $o((dt)^2)<o(dt)$ .
El juego de manos que parece misterioso es esta rareza $dW_t$ . Imagina $X_t=3t+2W_t$ . Ahora, al introducir lo anterior, obtenemos
$X_t-X_0=\int_0^t\frac{\partial X_t}{\partial t}dt+\oint \frac{\partial X_t}{\partial Wt}dW_t$
$X_t-X_0=\int_0^t 3 dt+\oint 2 dW_t$
El primer término puede verse, correctamente, como $3t$ . El segundo por razonamiento simbólico es $2W_t$ . Más estructuralmente, $dW_t$ es una variable aleatoria que es el límite diferencial de una RV distribuida como $N(0,1/k)$ como $k\rightarrow \infty$ . Es, en cierto sentido, un pequeño incremento de la varianza por sí solo que se acumula al doble de tiempo en este caso de $X_t$ .
El verdadero bicho raro es $dW_t^2$ . A pesar de que proviene de algo que tiene "sólo varianza" es al cuadrado. Cuando una RV distribuida como $X\sim N(0,1)$ , $X^2$ es un nuevo VR distribuido como una distribución chi-cuadrado: $X^2\sim \chi_1^2$ . Ahora, al descomponer esta distribución de un período en k subperíodos, obtenemos
$\sum _k \frac{1}{k} X^2 = \frac{1}{k}\sum _k X^2$ y $\sum_k X^2 \sim \chi_k^2$
pero $E[\chi_k^2]=k \Rightarrow E[\frac{1}{k}X^2]=1$
Y aquí está el problema. Al dividir la VR "sólo de la varianza" en fragmentos más pequeños, elevar al cuadrado y sumar las piezas, se obtiene algo que no se reduce más rápido que $dt$ a pesar de que aparentemente (notablemente) parece $dt^2$ Así, todo el mundo dice, $"dW_t^2=dt"$ .
En el fondo el problema es bastante sencillo, pero el uso del signo integral con $DW_t$ diferenciales hace que sea muy confuso. Todo lo que sucede realmente es que tenemos el problema repetido de que un término como $W_tdW_t$ co-varía: un delta-tick positivo en $W_t$ , $dW_t$ significa que ambos elementos suben juntos en dicho incremento. Y, si hay un negativo $dW_t$ garrapata $W_t$ baja para que el producto también sea siempre positivo. En cambio, cuando escribimos $\int t dt$ el tiempo siempre sube y $dt$ es siempre positivo a medida que t aumenta; $\int -t dt$ todavía tiene $dt$ subiendo. $dW_t$ Sin embargo, se permite que vaya en cualquier dirección (de ahí que sea una integral más parecida a la de Lebesgue que varía sobre el rango y no sobre el dominio). Hay que pensar en lo que $\int dW_t$ realmente significa, por lo que me gusta $\oint$ para minimizar las falsas conculcaciones erróneas.
Mis matemáticas son un poco descuidadas (¿por qué he utilizado $E[\chi^2]$ tanto la variación cuadrática de un camino como su valor esperado son los mismos para un paseo aleatorio; véase el libro de Shreve). Pero si quieres verlo delante de tus ojos, prueba a utilizar $X_t=3t+2W_t^2$ en lugar de la fórmula anterior. Entonces la segunda derivada tiene un valor que importa