Supongamos que tengo n
señales, que me gustaría ponderar linealmente y combinar para formar una señal agregada. Dos posibles formas de hacerlo basadas en datos históricos son:
- Retroceder el
n
señales sobre los rendimientos históricos. Utilizar las betas estimadas a partir de la regresión como las ponderaciones de las señales. - Estimar una matriz de covarianza de las señales a partir de los valores históricos de las señales. Estimar los rendimientos futuros (media) de las señales a partir de los rendimientos históricos de las mismas. Realizar una optimización de la media-varianza y obtener las ponderaciones óptimas de las señales.
Entiendo las diferencias técnicas entre estos dos enfoques (diferentes funciones objetivas), pero estoy tratando de entender (en la práctica) cuál es un mejor enfoque, ya que empíricamente llegan a respuestas similares.
En ambos casos, se utiliza el rendimiento histórico de la señal para estimar el rendimiento futuro de la misma (por ejemplo, el impulso de los rendimientos de la señal). En ambos casos, se puede restringir la optimización para lograr diferentes objetivos (restringir las ponderaciones para que sean positivas, sumar a 1, etc.). El objetivo de la regresión lineal -pérdida al cuadrado- es algo similar al objetivo de la varianza media en el sentido de que se está maximizando el rendimiento. No estoy seguro de que la parte de la minimización de la varianza sea tan obvia
Parece que el enfoque de la varianza media es un poco más flexible, se puede desenredar los rendimientos esperados de las estimaciones de covarianza (o incluso no tener estimaciones de los rendimientos esperados - por ejemplo, la varianza mínima). Me pregunto si alguien tiene alguna idea