Derivemos la prueba. Considera que estás corto de una opción y largo de su cobertura delta autofinanciada. Se obtiene la cartera $\Pi$ cuyo $t$ -valor verifica $$ \Pi_t = \underbrace{- V_t}_{\text{Short option}} + \underbrace{\Delta_t S_t}_{\text{Long stocks}} + \underbrace{\frac{(V_t - \Delta_t S_t)}{B_t} B_t}_{\text{Residual cash position}} $$ En el momento $t$ Esta posición tiene un valor cero: la opción está perfectamente replicada por la cobertura. Sin embargo, en cuanto pase el tiempo, tendrá que reequilibrar su cobertura para seguir siendo delta neutral. Veamos qué ocurre entre dos fechas de reequilibrio cuando mantenemos la delta sin cambios, por ejemplo $[t,t+dt[$ .
Dado que la estrategia se autofinancia, suponiendo que la cuenta del mercado monetario sin riesgo verifica la ODE $dB_t = B_t r dt$ y la acción no paga dividendos entonces tenemos que el error de replicación sobre $[t,t+dt[$ escribe $$ d\Pi_t = - dV_t + \Delta_t dS_t + (V_t - \Delta_t S_t) r dt \tag{0} $$ Ampliemos los diferentes términos en el orden trivial más bajo. Si consideramos un modelo de difusión pura (sin saltos) esto significa el orden 1 en $dt$ y la orden 2 en $dS_t$ . Suponiendo que usted está valorando la opción $V_t$ en un marco de BS con volatilidad $\sigma$ , el lema de Itô da \begin{align} dV_t &= \frac{\partial V}{\partial t} dt + \frac{\partial V}{\partial t} dS_t + \frac{1}{2} \frac{\partial^2 V}{\partial S^2} d\langle S \rangle_t \\ &= \theta_t dt + \Delta_t dS_t + \Gamma_t d\langle S \rangle_t \end{align} Conectando esto $(0)$ produce $$ d\Pi_t = \underbrace{(-\theta_t - rS_t \Delta_t + rV_t)dt}_{\text{(a)}} - \Gamma d\langle S \rangle_t \tag{1} $$ Los primeros términos $(a)$ debería resultarle familiar. De hecho, si usted está fijando los precios bajo el marco BS, entonces $v_t = V(t,S_t)$ debería verificar la PDE de precios de la BS $$ \theta_t + r S_t \Delta_t + \frac{1}{2} \Gamma S_t^2 \sigma^2 - r V_t = 0$$ Usando esto para reescribir $(1)$ produce el siguiente error de replicación en el periodo $[t,t+dt[$ \begin{align} d\Pi_t &= \frac{1}{2} \Gamma S_t^2 \sigma^2 dt - \Gamma d \langle S \rangle_t \\ &= \frac{1}{2} \Gamma S_t^2 \left( \sigma^2 - \frac{d \langle S \rangle_t}{(S_t)^2 dt} \right) dt \\ &= \frac{1}{2} \Gamma S_t^2 \left( \sigma^2 - \beta_t^2 \right) dt \end{align} donde $\beta^2$ es la variación cuadrática "real" de los rendimientos logarítmicos, es decir, no la postulada y valorada por su modelo, sino la forma en que se comporta realmente el mercado.
Ahora bien, si se quiere averiguar el error total de replicación hasta la madurez $T$ visto desde la hora actual $t$ sólo queda integrar y descontar las fugas infinitesimales de P&L descritas anteriormente $$ P\&L_t = \int_0^T e^{-r(T-t)} \frac{1}{2} \Gamma S_t^2 \left( \sigma^2 - \beta_t^2 \right) dt $$
Esta es una ecuación muy interesante y conocida porque vincula 3 conceptos importantes: $$ \int_0^T e^{-r(T-t)} \frac{1}{2} \underbrace{\Gamma}_{\text{Instrument related}} S_t^2 \left( \underbrace{\sigma^2}_{\text{Model related}} - \underbrace{\beta_t^2}_{\text{Market related}} \right) dt $$
Una interpretación ingenua de la misma sería la siguiente. Supongamos que vendo una opción vainilla valorando una volatilidad futura de $\sigma$ al inicio. Si la volatilidad realizada $\beta$ es siempre mayor que $\sigma$ entonces espero perder dinero, ya que esto equivaldría a haber subvalorado efectivamente la opción (nótese que el $\Gamma$ de una opción vainilla es siempre positiva).
El truco aquí es observar que la venta de una opción y la cobertura delta dinámicamente no es una operación de volatilidad pura. El término gamma en la ecuación P\&L anterior introduce una dependencia de la trayectoria: sólo en las trayectorias en las que $\Gamma(t,S_t)$ no es cero, se acumulará la discrepancia entre el precio y el vol. realizado y se cristalizará el P&L. Puede encontrar más información en este pregunta relacionada.
Por supuesto, como se menciona en los comentarios, esta ecuación de P\&L supone que no hay costes de transacción y que la negociación es continua (cuando se reequilibra dinámicamente la Delta). También tienes razón, en la práctica esto se utiliza para controlar la evolución diaria de una cartera con cobertura delta a posteriori. Suele formar parte de los cálculos de P&L explicados, por ejemplo.