1 votos

¿Cuál es la fórmula de autocorrelación correcta?

Estoy tratando de ver la influencia de la autocorrelación en mis procesos y para ello tengo que calcularla, sin embargo parece que es difícil encontrar una fórmula coherente en la web. He encontrado más o menos dos diferentes que son las siguientes :

First Formula

Second Formula

A pesar de que estas dos fórmulas son muy parecidas entre sí, parecen no coincidir en la forma de calcular los medios utilizados en varios puntos de las fórmulas.

Me cuesta averiguar cuál es la correcta, aunque me parezca que la primera es la correcta, comparada con la segunda, pero es pura intuición y no está justificada matemáticamente.

¿Alguien puede ayudarme a saber cuál es la correcta y por qué? Gracias a todos por su ayuda.

1voto

John Rennie Puntos 6821

La autocorrelación es la correlación de un proceso $X$ y su versión retardada, por lo que hay que considerarlo desde un punto de vista probabilístico. Utilice el $\sigma_\ell$ notación para el operador que desplaza un proceso: $${\cal A}(X;\ell):=\frac{\mathbb{E}\big((X - \mathbb{E}X) \cdot (\sigma_\ell\circ X - \mathbb{E}\sigma_\ell\circ X)\big)}{\sqrt{\mathbb{E}(X - \mathbb{E}X)^2 \cdot \mathbb{E}(\sigma_\ell\circ X - \mathbb{E}\sigma_\ell\circ X)^2}}.$$

Esta es la verdadera definición. Ahora hay que utilizar estimadores empíricos para todas estas cantidades.

Por lo general, tomamos $\frac{1}{N}\sum_{n=1}^N X_n$ como estimador de $\mathbb{E}X$ sobre una muestra de tamaño $N$ .

Te permito reemplazar y obtendrás la primera fórmula que has plasmado en tu pregunta.

Ahora piensa en el conjunto de información que tienes: sabes $X_t$ de $t=1$ a $t=N+\ell$ . Cuando se trata de estimar cantidades que no están en función de las dependencias entre $X$ y $\sigma_\ell\circ X$ ¿no es mejor utilizar toda la información disponible?

es decir $\frac{1}{N+\ell}\sum_{n=1}^{N+\ell} X_n$ puede ser un mejor estimador de $\mathbb{E}X$ simplemente porque se utilizan más observaciones (por supuesto está sometido a algunos supuestos de estacionariedad, como se ha subrayado en un comentario).

Aquí se habla de $\mathbb{E}X$ , $\mathbb{E}\sigma_\ell\circ X$ , $\mathbb{E}(X - \mathbb{E}X)^2$ y $\mathbb{E}(\sigma_\ell\circ X - \mathbb{E}\sigma_\ell\circ X)^2$ que son todos concernientes a $X$ sólo. Puedes estimarlas utilizando tantas observaciones como sea posible. Por supuesto, si te preocupan los valores atípicos, también puedes utilizar un método bootstrap (especialmente para los términos de varianza, ya que el bootstrap está diseñado para eso), o cualquier método que te guste.

Si lo hace, entonces recupera la última fórmula de su pregunta:

  1. en el numerador se utiliza $\bar X=1/N\sum_n X_n$ para $\mathbb{E}X$ y para $\mathbb{E}\sigma_l\circ X$ : $$\mathbb{E}\big((X - \mathbb{E}X) \cdot (\sigma_\ell\circ X - \mathbb{E}\sigma_\ell\circ X)\big)\simeq \mathbb{E}\big((X - \bar X) \cdot (\sigma_\ell\circ X - \bar X)\big).$$
  2. el denominador se reduce a $$\sqrt{\mathbb{E}(X - \mathbb{E}X)^2 \cdot \mathbb{E}(\sigma_\ell\circ X - \mathbb{E}\sigma_\ell\circ X)^2}\simeq \mathbb{E}(X - \bar X)^2.$$
  3. Cuando se juntan $${\cal A}(X;\ell)\simeq \frac{\sum_n (X_n - \bar X) (X_{n+\ell}-\bar X)}{\sum_n (X_n - \bar X)^2}.$$

Lo que es importante entender es que: ambas fórmulas son correctas ya que son estimadores de la misma estadística ${\cal A}(X;\ell)$ Esa es la verdadera fórmula. Depende de cómo quieras construir los estimadores. ¿Cuál es el mejor? Depende de la verdadera (no conocida) distribución del $X_t$ .

Yo diría que

  • si $X$ es estacionario, el segundo es el mejor ,
  • mientras que si $X$ no es estacionario, el primero puede ser mejor .

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X