La autocorrelación es la correlación de un proceso $X$ y su versión retardada, por lo que hay que considerarlo desde un punto de vista probabilístico. Utilice el $\sigma_\ell$ notación para el operador que desplaza un proceso: $${\cal A}(X;\ell):=\frac{\mathbb{E}\big((X - \mathbb{E}X) \cdot (\sigma_\ell\circ X - \mathbb{E}\sigma_\ell\circ X)\big)}{\sqrt{\mathbb{E}(X - \mathbb{E}X)^2 \cdot \mathbb{E}(\sigma_\ell\circ X - \mathbb{E}\sigma_\ell\circ X)^2}}.$$
Esta es la verdadera definición. Ahora hay que utilizar estimadores empíricos para todas estas cantidades.
Por lo general, tomamos $\frac{1}{N}\sum_{n=1}^N X_n$ como estimador de $\mathbb{E}X$ sobre una muestra de tamaño $N$ .
Te permito reemplazar y obtendrás la primera fórmula que has plasmado en tu pregunta.
Ahora piensa en el conjunto de información que tienes: sabes $X_t$ de $t=1$ a $t=N+\ell$ . Cuando se trata de estimar cantidades que no están en función de las dependencias entre $X$ y $\sigma_\ell\circ X$ ¿no es mejor utilizar toda la información disponible?
es decir $\frac{1}{N+\ell}\sum_{n=1}^{N+\ell} X_n$ puede ser un mejor estimador de $\mathbb{E}X$ simplemente porque se utilizan más observaciones (por supuesto está sometido a algunos supuestos de estacionariedad, como se ha subrayado en un comentario).
Aquí se habla de $\mathbb{E}X$ , $\mathbb{E}\sigma_\ell\circ X$ , $\mathbb{E}(X - \mathbb{E}X)^2$ y $\mathbb{E}(\sigma_\ell\circ X - \mathbb{E}\sigma_\ell\circ X)^2$ que son todos concernientes a $X$ sólo. Puedes estimarlas utilizando tantas observaciones como sea posible. Por supuesto, si te preocupan los valores atípicos, también puedes utilizar un método bootstrap (especialmente para los términos de varianza, ya que el bootstrap está diseñado para eso), o cualquier método que te guste.
Si lo hace, entonces recupera la última fórmula de su pregunta:
- en el numerador se utiliza $\bar X=1/N\sum_n X_n$ para $\mathbb{E}X$ y para $\mathbb{E}\sigma_l\circ X$ : $$\mathbb{E}\big((X - \mathbb{E}X) \cdot (\sigma_\ell\circ X - \mathbb{E}\sigma_\ell\circ X)\big)\simeq \mathbb{E}\big((X - \bar X) \cdot (\sigma_\ell\circ X - \bar X)\big).$$
- el denominador se reduce a $$\sqrt{\mathbb{E}(X - \mathbb{E}X)^2 \cdot \mathbb{E}(\sigma_\ell\circ X - \mathbb{E}\sigma_\ell\circ X)^2}\simeq \mathbb{E}(X - \bar X)^2.$$
- Cuando se juntan $${\cal A}(X;\ell)\simeq \frac{\sum_n (X_n - \bar X) (X_{n+\ell}-\bar X)}{\sum_n (X_n - \bar X)^2}.$$
Lo que es importante entender es que: ambas fórmulas son correctas ya que son estimadores de la misma estadística ${\cal A}(X;\ell)$ Esa es la verdadera fórmula. Depende de cómo quieras construir los estimadores. ¿Cuál es el mejor? Depende de la verdadera (no conocida) distribución del $X_t$ .
Yo diría que
- si $X$ es estacionario, el segundo es el mejor ,
- mientras que si $X$ no es estacionario, el primero puede ser mejor .