Permíteme compartir algunos pensamientos. No están formulados en detalle completo ni están rigurosamente probados, pero espero que la intuición sea correcta.
En el nivel de la población / proceso generador de datos
Supongamos que se conocen los rendimientos esperados $E(R^{ei})$ y las sensibilidades a los factores $\beta_{1,i}$, $\beta_{2,i}$, y nuestro objetivo es crear un buen modelo de fijación de precios de activos. Para empezar, considera un modelo de un factor que reconoce explícitamente su imperfección mediante la incorporación de errores de fijación de precios no nulos $\alpha_i^{(iii)}$. Denominemos al factor como $X_1$ y la prima de riesgo correspondiente como $\lambda_1$. El modelo es $$ E(R^{ei}) = \alpha_i^{(iii)} + \beta_{1,i} \lambda_1. \tag{iii} $$ Sin conocer los valores verdaderos $(\alpha_i^{(iii)},\lambda_1)$, podemos elegir un par $(\hat\alpha_i^{(iii)},\hat\lambda_1)$ que minimice alguna norma de $\hat\alpha_i^{(iii)}$: $||\hat\alpha_i^{(iii)}||$.
Ahora consideremos la inclusión de un factor adicional $X_2$ con una prima de riesgo $\lambda_2$ en el modelo. El modelo extendido se convierte en $$ E(R^{ei}) = \alpha_i^{(iv)} + \beta_{1,i} \lambda_1 + \beta_{2,i} \lambda_2. \tag{iv} $$ Sin conocer los valores verdaderos $(\alpha_i^{(iv)},\lambda_1,\lambda_2)$, siempre es posible elegir un conjunto de valores $(\tilde\alpha_i^{(iv)},\tilde\lambda_1,\tilde\lambda_2)$ de manera que $||\tilde\alpha_i^{(iv)}||\leq||\hat\alpha_i^{(iii)}||$. (En el peor de los casos, usa $\tilde\alpha_i^{(iv)}=\hat\alpha_i^{(iii)},\tilde\lambda_1=\hat\lambda_1,\tilde\lambda_2=0$ para lograr la igualdad.)
Ahora supongamos que las primas de riesgo $\lambda_1$ y $\lambda_2$ están disponibles. Lo único que es desconocido son los errores de fijación de precios, pero podemos obtenerlos inmediatamente a partir de $(\text{iii}) y $(\text{iv}). Al determinar los errores de fijación de precios de esa manera, ya no hay una garantía algebraica de que $||\tilde\alpha_i^{(iv)}||\leq||\hat\alpha_i^{(iii)}||$.
En el nivel de la muestra
Los valores que asumimos como conocidos en la población usualmente tendrán que ser reemplazados por estimaciones (a menos que tengamos algunos de los valores implicados por alguna teoría). Por ejemplo, si asumimos que algunos parámetros permanecen constantes en el tiempo, podríamos estimarlos a partir de observaciones de series temporales de las variables. O si construimos un modelo que determina cómo evolucionan estos valores con el tiempo, aún podríamos estimarlos a partir de una muestra de series temporales. Si no imponemos restricciones en $\lambda_1$ y $\lambda_2$, el equivalente de muestra de $||\tilde\alpha_i^{(iv)}||\leq||\hat\alpha_i^{(iii)}||$ debería seguir siendo válido. Si imponemos restricciones en $\lambda_1$ y $\lambda_2$*, es posible que el equivalente de muestra de $||\tilde\alpha_i^{(iv)}||\leq||\hat\alpha_i^{(iii)}||$ falle.
*Por ejemplo, si $X_j$ es un rendimiento en exceso y asumimos constancia de parámetros en el tiempo, podemos estimar $\lambda_j$ mediante la media de muestra de $X_j$.