10 votos

La Copula Correlaciones

Parece que la muestra coeficiente de correlación lineal de $\hat{\rho}$ de las muestras generadas por una cópula que es parametrizadas por $\rho$ es igual a $\rho$. Por ejemplo, puedo construir una cópula Normal con el parámetro $\rho = 0.9$. Me genera un montón de muestras de esta cópula, y calcular su muestra el coeficiente de correlación de $\hat{\rho}$. Me estoy dando cuenta de que $\hat{\rho}$ es un poco, pero siempre menos de $\rho$ para muestras grandes (alrededor de 0.891). Esto es confuso para mí, como no $E[\hat{\rho}] = \rho$, como la cópula Normal es el único parametrizadas por $\rho$? Cualquier ayuda sería muy apreciada. Gracias!

13voto

Thanassis Puntos 66

Esto no puede ser una consecuencia de estimadores sesgados o error de muestreo. No creo que sea una coincidencia que

$$\frac{6}{\pi} \arcsin\left(\frac{0.9}{2} \right) = 0.891457\ldots \aprox 0.891$$

Cópula de construcción consiste en la aplicación de transformaciones no lineales de variables aleatorias, que no necesita preservar la correlación.

Si las variables aleatorias $X$ y $Y$ son conjuntamente normal, con una correlación $\rho$, entonces con $\Phi$ denota la univariante estándar de la distribución normal de la función, tenemos

$$corr(\Phi(X), \Phi(Y)) = \frac{6}{\pi}\arcsin \frac{\rho}{2}$$.

Para una prueba, podemos hacer una adecuada transformación, de modo que $X$ y $Y$estándar normal distribuciones marginales y la misma correlación.

Entonces tenemos

$$\etiqueta{*}E(\Phi(X) \Phi(Y)) = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} \left(\int_{-\infty}^x \phi(u)\, du\derecho) \left( \int_{-\infty}^y \phi(v)\ dv\derecho)f(x,y;\rho)\, dx \, dy,$$

donde $\phi$ es el estándar normal de la función de densidad de y $f$ es el estándar normal bivariante función de densidad.

Observe que (*) es equivalente a la probabilidad conjunta de que $U \leqslant X$ y $V \leqslant Y$ donde $U$ y $V$ estándar son aleatorias distribuidas normalmente las variables que están correlacionadas con cada uno de los otros y donde cada uno tiene correlación con $X$ y $Y$:

$$E(\Phi(X)\Phi(Y)) = P(U \leqslant X, V\leqslant Y) = P(X-U \geqslant 0, Y-V \geqslant 0).$$

Ahora $X_1 = X-U$ y $X_2 = Y-V$ ambos están distribuidos normalmente con una media de $0$, desviación estándar $\sqrt{2}$, y con correlación

$$\text{corr}(X_1,X_2) = \frac{E((X-U)(Y-V))}{\sqrt{\text{var}(X-U)}\sqrt{\text{var}(Y-V)}} \\= \frac{E(XY)-E(XV) - E(YU) + E(UV)}{\sqrt{2}\sqrt{2}} \\ = \frac{\rho}{2}$$

Es bien sabido que si $Z_1$ y $Z_2$ tienen un estándar de la distribución normal bivariante con correlación $\rho'$, entonces el orthant probabilidad es

$$P(Z_1 \geqslant 0, Z_2 \geqslant 0) = \frac{1}{4} + \frac{1}{2 \pi}\arcsin \rho'.$$

Por lo tanto,

$$E(\Phi(X)\Phi(Y)) = P(X_1, \geqslant 0, X_2\geqslant 0) = P(X_1/\sqrt{2} \geqslant 0, X_2/\sqrt{2}\geqslant 0) =\frac{1}{4} + \frac{1}{2\pi} \arcsin \frac{\rho}{2}.$$

Desde $\Phi(X)$ y $\Phi(Y)$ son distribuidos de manera uniforme en $[0,1]$ tenemos

$$E(\Phi(X)) = E(\Phi(Y)) = \frac{1}{2}, \\ var(\Phi(X)) = var\Phi(Y)) = \frac{1}{12}$$

Así

$$corr(\Phi(X), \Phi(Y)) = \frac{E(\Phi(X)\Phi(Y)) - E(\Phi(X))E(\Phi(Y))}{\sqrt{var(\Phi(X))}\sqrt{var(\Phi(Y))}} =\frac{6}{\pi} \arcsin \frac{\rho}{2}$$

4voto

dotnetcoder Puntos 1262

Me imagino que usted es calcular el estimador de máxima verosimilitud:

$ \hat{\theta} = \frac{1}{N} \sum (x_i - \bar{x}) (y_i - \bar{y}) $

en lugar de el imparcial estimador:

$ \hat{\theta} = \frac{1}{N-1} \sum (x_i - \bar{x}) (y_i - \bar{y}) $

El imparcial estimador tiene un sesgo de cero, es decir :

$ E_{x|\theta}[\hat{\theta}] - \theta = 0 $

El imparcial estimador es, obviamente, un poco más grande y se ajusta a su situación descrita, basada en mi hipótesis implica que utiliza el 100 muestras, lo cual es bastante bajo por el camino.

3voto

scottishwildcat Puntos 146

Esta es una observación interesante que tiene. La parte interesante es "siempre más pequeña".

La cópula normal se basa en una distribución normal multivariante. La correlación de salir es el parámetro de correlación de poner en. Todo lo demás es muy probablemente debido a un problema en su enfoque. Si usted no dice "consistentemente menor", yo diría que es un error de muestreo.

Vamos a intentar encontrar el problema: ¿Cuáles son sus distribuciones marginales? ¿Cuál es la dimensión de su modelo? Cuántas muestras sacas?

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X