Estoy siguiendo la metodología descrita en Desarrollo de modelos de negociación de acciones de alta frecuencia . En la página 27, el autor esboza un modelo de regresión OLS para obtener los coeficientes beta. El modelo se define como
$$r_{t+1} + ... + r_{t+H} = \beta_1\sum_{i=0}^HD_{t-i,1}+...+\beta_{k}\sum_{i=0}^HD_{t-i,k}+\eta_{t+H,H}$$
Dónde $r_{t+1} + ... + r_{t+H}$ es el acumulado $H$ -período de retorno del registro, $D=R^{T,k}$ es un $Txk$ matriz de rendimientos logarítmicos reducidos dimensionalmente (componentes principales) obtenida tras proyectar los rendimientos logarítmicos desmedidos en el $k$ vectores propios.
El autor define el proceso de estimación $r_{t+1} + ... + r_{t+H}$ como tal:
Calculamos el futuro acumulado $H$ -período de retorno de los registros. A continuación, realizamos una regresión, estimada por MCO, sobre los rendimientos logarítmicos acumulados futuros con la última suma de $H$ -período de rendimientos dimensionalmente reducidos en el espacio de componentes principales.
Estoy luchando un poco para entender cómo implementar este modelo. Supongo que donde estoy más confundido es en la afirmación "Calculamos el futuro acumulado $H$ -período de retorno del registro". Veo claramente que las variables independientes son el acumulado $H$ -período de rendimientos logarítmicos reducidos, pero no entiendo cuál sería la variable dependiente en este caso, ya que no tenemos rendimientos acumulados futuros.
Es probable que se trate de una simple cuestión de sintaxis, pero es algo que también me ha confundido en el pasado. En pocas palabras, ¿cuál es la variable independiente en este modelo?