Así es como entiendo el modelo de regresión lineal con un solo regresor: Suponemos que la función de regresión de la población tiene la forma de $Y_i=\beta_0+\beta_1X_i+u_i$ . Además, para que los parámetros tengan significado de causalidad, suponemos que:
- $E(u_i|X_i)=0$
- $(X_i,Y_i)$ son i.i.d. para $i=1,...,n$
- Los grandes valores atípicos son poco probables
Mi primera pregunta es sobre el primer supuesto. Ésta, combinada con la suposición de que $Y=\beta_0+\beta_1X$ , da $E(Y|X)=\beta_0+\beta_1X$ . ¿Pero no es esta ecuación el punto de partida de nuestro análisis de regresión? Si no es así, ¿qué intentamos captar en primer lugar?
Parece que o bien $E(u_i|X_i)=0$ o $E(Y|X)=\beta_0+\beta_1X$ combinado con la suposición de que $Y_i=\beta_0+\beta_1X_i+u_i$ implica la otra. ¿Qué es lo primero?
Mi segunda pregunta es sobre la expectativa de $u$ . ¿Suponemos que $E(u_i)=0$ ¿o está implícito en otros supuestos? Porque en la Introducción a la Econometría de Wooldridge, es un supuesto, pero en la de Stock y Watson, parece que está implícito. Estoy confundido.