Suponiendo un precio del activo $S$ sigue un movimiento browniano geométrico (GBM), el log devuelve $R$ se distribuyen como $$ R_i := \log\left(\frac{S_i}{S_{i-1}}\right) \sim \mathcal{N}\left(\left(\mu - \frac{\sigma^2}{2}\right) \Delta t, \sigma^2 \Delta t \right), \quad i=1,\ldots,N. $$
Sea $m = \left(\mu - \frac{\sigma^2}{2}\right) \Delta t$ y $s^2 = \sigma^2 \Delta t$ y considerar la calibración de un GBM para algunos rendimientos $R_i$ . Utilizaremos la estimación de máxima verosimilitud para $m$ y para simplificar suponemos $s$ es conocida (como ocurriría si nosotros mismos generáramos los datos mediante una simulación), en cuyo caso $$ \hat{m} = \frac{1}{N} \sum_{i=1}^M R_i. $$ Entonces la distribución muestral para la media muestral es aproximadamente $\hat{m} \sim \mathcal{N}\left(m, \frac{s^2}{N}\right)$ y una aproximación $(1-\alpha)100\%$ intervalo de confianza para la media real $m$ est $$ [\hat{m} - z_{\alpha/2}\frac{s}{\sqrt{N}},\: \hat{m} + z_{\alpha/2}\frac{s}{\sqrt{N}}] \qquad (1). $$ En particular, el aumento del número de observaciones $N$ da lugar a un intervalo de confianza menor. Esto, por supuesto, es un resultado estándar de la estadística elemental.
Por otro lado, realmente necesitamos una estimación para $\mu$ en la práctica, y de $(1)$ podemos obtener un intervalo de confianza para $\hat{\mu} = \frac{\hat{m}}{\Delta t} + \frac{\sigma^2}{2}$ : \begin{align*} & \hat{m} - z_{\alpha/2}\frac{s}{\sqrt{N}} < m < \hat{m} + z_{\alpha/2}\frac{s}{\sqrt{N}} \\ & \qquad \iff \hat{m} - z_{\alpha/2}\frac{s}{\sqrt{N}} < \left(\mu - \frac{\sigma^2}{2}\right) \Delta t < \hat{m} + z_{\alpha/2}\frac{s}{\sqrt{N}} \\ & \qquad \iff \frac{\hat{m}}{\Delta t} + \frac{\sigma^2}{2} - z_{\alpha/2}\frac{s}{\Delta t\sqrt{N}} < \mu < \frac{\hat{m}}{\Delta t} + \frac{\sigma^2}{2} + z_{\alpha/2}\frac{s}{\Delta t\sqrt{N}} \\ & \qquad \iff \hat{\mu} - z_{\alpha/2}\frac{\sigma}{\sqrt{N \Delta t}} < \mu < \hat{\mu} + z_{\alpha/2}\frac{\sigma}{\sqrt{N \Delta t}}. \end{align*} Entonces, puesto que $\Delta t = \frac{T}{N}$ para un tiempo de observación final $T$ , a $(1-\alpha)100\%$ intervalo de confianza para la deriva verdadera $\mu$ est $$ [\hat{\mu} - z_{\alpha/2}\frac{\sigma}{\sqrt{T}},\: \hat{\mu} + z_{\alpha/2}\frac{\sigma}{\sqrt{T}}]. $$ En particular, el aumento del número de observaciones $N$ no tiene ningún efecto sobre el intervalo de confianza para la deriva $\mu$ . En cambio, sólo obtenemos un intervalo de confianza menor aumentando el tiempo final, $T$ .
En efecto, para $T$ podemos pensar en obtener datos de frecuencias cada vez más altas para que $N$ se hace cada vez mayor. Pero entonces $\Delta t$ se hace cada vez más pequeño por definición, de forma que $dt = \frac{T}{N}$ . Esto parece bastante contraintuitivo: para $T$ , no importa si tengo 1.000 o $1e16$ observaciones, no me acerco a mi verdadera deriva $\mu$ . En cambio, si sólo dispongo de 10 observaciones a lo largo de 100 años, obtengo una estimación mucho mejor de $\mu$ .
¿He pasado algo por alto? ¿Quizá se trata de un problema bien conocido de estimación de la deriva que desconozco?