1. Supuestos básicos del modelo
Sea $X_t^{(i)}$ denota la rentabilidad en el momento $t=1,2,...,T$ para acciones $i=1,2,...,m$ . Supongamos que cada serie de rendimientos bursátiles es una serie estacionaria y que $X_t^{(i)}\sim \mathcal{N}(\mu_i, \sigma_i^2)$ . Ahora supongamos que usted tiene una predicción $Y_t^{(i)}\sim \mathcal{N}(\nu_i, \eta_i^2)$ y definir $IC_{ts}^{(i)}:=\text{corr}(X^{(i)}, Y^{(i)})$ . La distribución condicional de la rentabilidad dada la predicción es entonces $X_t^{(i)}|Y_t^{(i)}=y_t^{(i)} \sim \mathcal{N}\left(\mu_i + IC_{ts}^{(i)} \frac{\sigma_i}{\eta_i}(y_t^{(i)}-\nu_i), \left(1-{IC_{ts}^{(i)}}^2\right)\sigma_i^2\right)$ .
2. Sus dos formas de medir $IC$ ¿Qué estamos midiendo?
Medida 1. Series temporales $IC_{ts}$ para cada acción, calcule la correlación de Pearson de su predicción y el rendimiento realizado a lo largo del tiempo, y luego promediar todas las valores.
Tenemos que $IC_{ts}^{(i)}:=\text{corr}[X^{(i)},Y^{(i)}]$ que es la correlación entre dos series temporales estacionarias, por lo que la media y la varianza de ambas están bien definidas y son constantes a lo largo del tiempo. Cree ahora una cartera de acciones con la misma ponderación, que tendrá una rentabilidad de $\widetilde X_t=\tfrac{1}{m}\sum_{i=1}^m X_t^{(i)}$ y predicción $\widetilde Y_t=\tfrac{1}{m}\sum_{i=1}^m Y_t^{(i)}$ . Además, supongamos que todas las series de rendimientos tienen la misma varianza, $\sigma_i=\sigma$ para todos $i$ y todas las predicciones tienen la misma varianza, $\eta_i=\eta$ para todos $i$ y que $cov[X^{(i)},X^{(j)}]=0$ para $i\neq j$ . La correlación entre el rendimiento de la cartera y la predicción de la cartera es entonces $\widetilde{IC}_{ts}:=\text{corr}(\widetilde X_t, \widetilde Y_t) = \tfrac{1}{m}\sum_{i=1}^m IC_{ts}^{(i)}$ que es la media aritmética de las correlaciones individuales entre la rentabilidad y la predicción. Por lo tanto, este método de cálculo de la correlación es el $IC_{ts}$ para una cartera con restricciones especiales sobre ponderaciones, varianzas y covarianzas cruzadas.
Medida 2. Sección transversal $IC_{cs}$ para el periodo de tiempo, calcule el Pearson de las predicciones de todas las acciones y los rendimientos realizados, a continuación promediar a lo largo del tiempo
Ahora bien, este método es problemático, porque la serie muestral $\{X_t^{(i)}\}_{i=1}^m$ no procede de la misma población. Recuerde que una estadística muestral (media, varianza, covarianza, correlación) pretende describir una población de la que se toman las muestras. Obviamente, nada te impide suponer que proceden de la misma distribución y calcular los estadísticos muestrales, pero la inferencia se vuelve problemática. Por lo tanto, No hablaré más de este método.
3. Dos estrategias, diferentes pero iguales
Estrategia 1. Para cada valor perseguimos su rendimiento en la serie temporal, que es similar a las estrategias CTA que se benefician del impulso y los retrocesos. Las acciones se tratan de forma independiente como materias primas diferentes, pero puede haber un marco general para controlar el riesgo de la cartera y gestionar las posiciones. posiciones.
Estrategia 2. Podemos hacer una estrategia long short, optimizar las ponderaciones de la cartera controlando ciertas medidas de riesgo o manteniendo la beta/dólar neutral.
Yo diría que estas dos "estrategias" se pueden realizar ambas utilizando Medida 1 . En Estrategia 1 simplemente se supone que las acciones son independientes, y se forma una cartera ponderada de rendimientos $\widetilde{X_t} = \sum_i w_i X_t^{(i)}$ y luego encuentras tus pesos $w_i$ mediante la optimización de algunos criterios o de criterios combinados, como la neutralidad en dólares, la maximización de la utilidad (max Sharpe). Cada acción sigue siendo una apuesta independiente, pero se combinan para decidir dónde asignar el capital. La predicción puede utilizarse como estimación de la rentabilidad, o la rentabilidad condicional dada la estimación, al optimizar los criterios utilizados. Estrategia 2 funciona igual pero no se supone que las acciones sean independientes. Por ejemplo, la varianza de su cartera ahora también incluye las covarianzas entre los rendimientos de las acciones. El resto es igual.
Mi pregunta es, si los dos CI están a escalas similares, (en realidad en mi experiencia ICcs es generalmente mayor que ICts con el mismo conjunto de predicciones y el mismo tiempo de retrospección), ¿cuáles son los pros y los contras para cada estrategia?
Dada la razonable suposición de modelo que hice, expliqué que $IC_{cs}$ tenía poco sentido, y que deberías seguir con $IC_{ts}$ pero probablemente no realice una media aritmética, sino una ponderada basada en las ponderaciones de su cartera. La razón por la que observas diferentes valores de las mismas es porque esa correlación no es una función lineal de las muestras. Bajo algunos supuestos, como varianzas iguales y correlaciones nulas, $IC_{ts}=IC_{cs}$ . Pero no se preocupe, utilice $IC_{ts}$ ya que es la única que tiene sentido.
En cuanto a suponer que los rendimientos de las acciones son independientes. La ventaja es que tiene menos parámetros que estimar (no hay estimación de la matriz de covarianza). Usted menciona que tiene $T=m$ es decir, el mismo número de muestras de rentabilidad que de acciones diferentes. Para estimar una matriz de covarianzas se desea tener $T>m$ y preferiblemente $T>10\cdot m$ . La desventaja es que no tiene en cuenta que los rendimientos están "relacionados", por lo que podría tener problemas para construir una cartera long-short eficiente que sea, por ejemplo, neutral con respecto al mercado. Pero también depende de su modelo de predicción, si incluye el riesgo sistemático.
4. Supuestos del modelo ampliado
Ampliemos este modelo suponiendo que los rendimientos siguen un $m$ -gaussiana, $\bf X_t \sim \mathcal{N}_m(\vec{\bf{0}}, \bf\Sigma_{xx})$ y el vector de predicción $\bf Y_t \sim \mathcal{N}_m(\vec{\bf{0}}, \bf\Sigma_{yy})$ . Entonces el devolución condicional dada la predicción es
\begin{align} X_t|Y_t &=y \sim \mathcal{N}_m(\mu_{x|y}, \Sigma_{x|y}), \\ \mu_{x|y} &= \Sigma_{xy}\Sigma_{yy}^{-1} y, \\ \Sigma_{x|y} &= \Sigma_{xx}-\Sigma_{xy}\Sigma_{yy}\Sigma_{xy}, \end{align} donde covarianza de retorno $\Sigma_{xx}$ se estima a partir de los rendimientos históricos, y la covarianza de predicción $\Sigma_{yy}$ depende de su modelo de predicción, y la covarianza cruzada $\Sigma_{xy}$ depende de la eficacia de las covariables del modelo de predicción (correlaciones mediante $IC_{ts}$ ) con los rendimientos. Para simplificar, supongamos que la predicción sólo $\Sigma_{xy}=\text{diag}_i(\sigma_i\eta_i IC_{ts}^{(i)})$ es decir, la predicción para el activo $i$ sólo covariables con rentabilidad $i$ y asumir $\Sigma_{yy}=\text{diag}_i(\eta_i^2)$ es decir, la predicción sólo depende de la mecánica bursátil idiosincrásica asociada.
La rentabilidad esperada condicional se distribuye entonces con media $\mu_{x|y}=\text{diag}_i\left(\frac{\sigma_i}{\eta_i} IC_{ts}^{(i)}\right)y = \text{vector}_i\left(\frac{\sigma_i}{\eta_i} IC_{ts}^{(i)}y_i\right)$ y covarianza $\Sigma_{x|y} = \Sigma_{xx}-\text{diag}_i\left(\sigma_i^2 {IC_{ts}^{(i)}}^2\right)$ .
Ahora puede utilizar esto para la optimización de su cartera, por ejemplo, maximizando el ratio de Sharpe según el CAPM con o sin restricciones sobre el dólar neutral, etc.