Estoy leyendo sobre la opción americana y las fuentes me han confundido en la parte en la que se considera la opción de venta americana sobre un activo que no paga dividendos.
Entiendo que el pago de una opción de venta americana al vencimiento viene dado por $$\max\left\{K-S(T),0\right\}$$ donde $K$ es el precio de ejercicio y $S(T)$ es el precio del subyacente al vencimiento.
Algunas fuentes afirman que considerando el n-arbitraje, el problema de la opción de venta americana tiene como objetivo encontrar el valor de la opción $$P(S,t)=\sup_\tau EG_\tau$$ donde $G_\tau$ es la función de ganancia y E es la expectativa.
A mi entender, la función de ganancia es equivalente a la función de recompensa, por lo que $$V(S,t)=\sup_\tau E[max\left\{K-S(\tau),0\right\}]$$ para todos los tiempos de parada $\tau$ .
Sin embargo, también me topé con fuentes que dicen que $$(S,t)=\sup_\tau E[e^{-r(\tau-t)}\max\left\{K-S,0\right\}]$$ para todos los tiempos de parada $\tau$ .
¿Cuál podría ser la explicación detrás de esto?