La ecuación de rentabilidad no es más que una ecuación econométrica que modela la rentabilidad de las acciones (u otros activos) en función de: (i) el intercepto (es decir, la rentabilidad media), (ii) algunas variables/características independientes, (iii) el ruido que tiene media cero y varianza variable en el tiempo. A veces también hay otras cosas en la ecuación de rentabilidad que forman modelos más avanzados. La principal diferencia entre una ecuación de rendimiento en este tipo de modelización y en el MCO estándar es que se permite que la varianza de los errores (y, por lo tanto, de los rendimientos) cambie con el tiempo, dejando de lado el supuesto de homocedasticidad.
La ecuación de retorno en los modelos de tipo ARCH/GARCH suele venir dada por $R(t) = \mu(t) + \epsilon(t)$ , donde $R(t)$ es el retorno uniforme, $\mu(t)$ es alguna intercepción (quizás $\mu(t) = \mu(z) \forall t \not=z \wedge t,z\in \mathbb{R}_+$ especificando el rendimiento esperado de la población en el paso de tiempo $t$ y $\varepsilon(t) := \sigma(t) z(t) \sim D(0,\sigma(t)^2)$ es una perturbación heteroscedástica, cuya dirección es impredecible pero cuya varianza es predecible dentro de un cierto error. Dicha ecuación de predicción viene dada por una ecuación de varianza (en contraposición a una ecuación de rendimiento).
Lo anterior es una simple ecuación de retorno. Puede tener lo que quiera. Es común ver $R(t) = \mu(t) + \sum_{i=1}^N \beta_i(t)f_i(X_i(t)) + \varepsilon(t)$ donde $f_i$ es una transformación (quizás un mapeo de identidad), $X_i$ es una característica, $\beta_i(t)$ son cargas factoriales variables o invariables en el tiempo con sus propias distribuciones. De forma más general, esta ecuación puede modelar un vector de rendimientos y estaríamos entrando en el territorio de la modelización MGARCH.
En mi opinión, todo esto está superado por los modelos de aprendizaje automático.
Creo que lo que él está hablando puede y ha sido modelado como un modelo GARCH-IN-MEAN (GARCH-M), donde el término garch hace una aparición elegante en la ecuación de la media (es decir, la ecuación de retorno). Creo que esto es lo que se utiliza para analizar la dinámica entre el ruido y los operadores informados en la literatura académica. La ecuación de retorno más básica que tienes arriba tiene que $E[R(t)] = E[\mu(t)]$ que suele ponerse a cero a priori cuando se modelan frecuencias diarias o superiores dejando así la ecuación de retorno modelada como la media cero $R(t) := z(t)\sigma(t)$ . O si no se hace esta suposición, la media calibrada sería pequeña para las acciones. Suponiendo que $R(t)$ depende lineal y positivamente de $\sigma(t)$ y como $E[\sigma(t)]>0$ En este caso, podemos ver a qué se refiere cuando dice que la media ya no será cero en la ecuación de la rentabilidad. La estimación del coeficiente de este término en la ecuación de rentabilidad puede interpretarse como la compensación que necesitan los inversores por mantener un activo que les proporciona el riesgo inherente a $\sigma(t)$ .
Si la estimación del coeficiente es $>0$ En este caso, diríamos que tenemos pruebas sugestivas de que el agente representativo (un objeto matemático cuyas propiedades/estado se supone que modelan al agente "medio") busca el riesgo, y tiene aversión al riesgo para $<0$ estimación.