Hace unos días hablaba con un colega y me surgió la siguiente pregunta:
¿Por qué no podemos utilizar simplemente las matrices de proyección y el Teorema FWL para "ganar" algunos grados de libertad en caso de muy pocas observaciones?
Imagina un caso en el que quieres estimar
$$y_t = \beta_0 + z\beta_1 + x_2\beta_2 + x_3\beta_3 + u_t$$
pero, por desgracia, sólo tienes 5 observaciones (ejemplo extremo). Por suerte, sólo le interesa $\beta_1$ . Ahora sólo hay que crear unas matrices de proyección de la forma
$$ M_x = I - x'(x'x)^{-1}x'$$
y proyectar su "no deseado" $x_2$ y $x_3$ (siguiendo a Davidson y MacKinnon). Quedaría la regresión
$$M_x y = M_x z \beta_1 + residuals$$
donde $\beta_1$ es numéricamente la misma que en la regresión anterior. Pero ahora se puede estimar un solo parámetro (beta) con 5 observaciones en comparación con los tres parámetros anteriores. Así que, obviamente, las estimaciones mejoran, ¿no?
¿Dónde está nuestro error?
0 votos
Zen, por ganar grados de libertad, ¿se refiere a cuando se utiliza una prueba F para probar la significación de $\beta_1$ ?
0 votos
Los grados de libertad en una prueba F también se pueden aumentar de esta manera, ya que parece que es posible obtener estimaciones con mayor precisión de esta manera. Realmente no tengo un argumento analítico para ello, pero especialmente en los casos con pocas observaciones parece que la disminución de los parámetros a estimar podría tener un gran efecto en la calidad de su regresión y esto, en cierto modo, se siente como "hacer trampa" de alguna manera.
0 votos
Creo que la última ecuación no satisface los supuestos habituales, a saber, que no haya autocorrelación. Cada residuo es una combinación lineal de todos los $u_t$ . Así que, aunque $u_t$ son independientes, cada uno $\hat u_t$ no lo es.
0 votos
Esto encajaría mejor Validación cruzada que la Economía Stack Exchange.
0 votos
Creo que la pregunta encaja perfectamente aquí. Véase aquí las discusiones anteriores al respecto: economics.meta.stackexchange.com/questions/1484/