1 votos

N necesario para un error de seguimiento estadísticamente significativo

Digamos que tengo el cálculo del tracking error de una cartera:

enter image description here

¿Cómo puedo determinar las N-obervaciones necesarias para un error de seguimiento estadísticamente significativo? O bien, ¿cómo puedo determinar si el error de seguimiento es estadísticamente significativo?


Un poco de código ilustrativo aquí

import statsmodels.stats.moment_helpers as mh
import pandas as pd
import numpy as np
def generate_correlated_random_return_matrix(annual_means, annual_vols, corr, t_periods, n_samples, period_adjust=12.):
    """
    Generates a return matrix from a multivariate random normal distribution.

    **Args**:
        *annual_means*: An array of mean annual returns.

        *annual_vols*: An array of annual vols.

        *corr*: Correlation matrix. An example being:
            >>> [[1,0],[0,1]]

        *t_periods*: How many months would you like to simulate?

        n_samples**: How many times do you want to run this simulation?
    """
    means = np.divide(annual_means, period_adjust)

    vols = np.divide(annual_vols, period_adjust ** .5)

    cov = np.asmatrix(mh.corr2cov(corr, vols), float)

    sim_array = np.random.multivariate_normal(means, cov, [n_samples, t_periods])

    return sim_array

te_tests = generate_correlated_random_return_matrix(annual_means=[.03,.03],annual_vols=[.1,.1],corr=[[1,.8],[.8,1]],t_periods=10000,n_samples=1)

df = pd.DataFrame(te_tests[0])

expanding_te = pd.expanding_std(df[0] - df[1])

mu = (df[0] - df[1]).std()

true_te = (df[0] - df[1]).std()

vol_of_expanding_TE = expanding_te.std()

z_score_of_TE_at_obs_N = ((expanding_te - true_te)/vol_of_expanding_TE).plot()

Este Supongo que me permitiría afirmar que el "TE medido es estadísticamente indistinguible del TRUE TE", supongo. Sin embargo, no estoy seguro de que lo que estoy utilizando como desviación estándar sea correcto.

2voto

dotnetcoder Puntos 1262

Supongamos que usted tiene una cartera que tiene algunos desconocidos real error medio de seguimiento, $t$ en relación con el punto de referencia, con una cierta varianza real $\sigma_t^2$ .

Tiene un proceso de muestreo generado a partir de sus datos que determina el estimado error medio de seguimiento, $\hat{t}$ según su fórmula, y por supuesto se puede derivar un estimado también la varianza en el error de seguimiento, $\hat{\sigma_t^2}$ .

¿Cómo puede evaluar la confianza en su conjunto de datos en relación con los valores reales desconocidos?

1) Puede realizar una muestra bootstrap no paramétrica: En este método se crean múltiples conjuntos de datos de muestras bootstrap mediante el remuestreo (con sustitución) de los errores de seguimiento de su conjunto de datos. A continuación, se obtiene un intervalo de confianza a partir de los estadísticos de los estimadores bootstrap.

Como ejemplo, suponga que tiene 5 puntos de datos, 5 días de errores de seguimiento:
[ 1, 2, 1, 3, 20 ], tiene una media de 5,4 y una varianza de 67. ¿Cómo de precisos o engañosos pueden ser estos estimadores? Realizo 100 muestras bootstrap (con reemplazo) y la distribución resultante que obtengo de los estimadores de la media se representa:

enter image description here

Debido al escaso número de muestras (y a los posibles valores atípicos), el resultado es bastante dramático. Yo sugeriría que no se puede evaluar con confianza que se tiene un estimador preciso del error de seguimiento medio en 5,4. Sin embargo, con un número de muestras mucho mayor, creo que podrá obtener un valor bastante seguro.

Por ejemplo, supongamos que amplío el conjunto de datos de errores de seguimiento a 20 puntos de datos:
[1, 2, 1, 3, 20, 5, 3, 2, 8, 9, 4, 4, 7, 16, 2, 2, 2, 7] tiene una media de 5,4. Ahora, 100 muestras bootstrap producirán la siguiente distribución de estimadores de la media:

enter image description here

2) Puede realizar el mismo proceso para una muestra bootstrap paramétrica donde se asume que el error de seguimiento tiene alguna distribución subyacente, y también se puede hacer esto para el estimador de la varianza.

En tu caso esto podría ser más apropiado, ya que tienes una distribución normal multivariada subyacente.

En este caso, yo replantearía la pregunta como cuál es la amplitud del rango de los valores del estimador de TE que es estadísticamente significativo dado que N toma diferentes valores.

Por ejemplo, supongamos que creo 20 muestras bootstrap paramétricas para los casos en que N es 3, 6 o 24 en cada muestra. Tengo una cartera de referencia simple con ponderaciones [1,1] y una cartera de seguimiento de [0,9, 1,1]. He simulado los movimientos del mercado con una distribución uniforme simple y sin correlación y he calculado el TE según su fórmula. La distribución de los estimadores de TE que obtuve fue la siguiente

enter image description here

Evidentemente, a medida que N aumenta, la varianza de las distribuciones de los estimadores es menor y, al realizar este tipo de análisis, se puede hacer referencia a intervalos de confianza definitivos con los que se pueda trabajar cómodamente. Por ejemplo, en este caso es estadísticamente improbable que el error de seguimiento sea +- 0,2 del valor real con N=24, pero con N=3 hay una posibilidad razonable de que ocurra.

Estos métodos forman parte del campo de la estadística computacional intensiva.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X