¿cuál es exactamente la variación utilizada en el modelo 3 con las variables de unidad y tiempo tiempo?
La variación que se utiliza para identificar $\beta_3$ es básicamente la desviación a nivel individual de la media individual y de la media de los individuos del año. Por lo tanto, en la medida en que su variable de interés varíe a lo largo del tiempo pero no varíe de forma diferencial entre los individuos, no podrá detectar su efecto.
Los economistas que utilizan el modelo 3 suelen decir vagamente que "han controlado los efectos fijos de la unidad y los efectos fijos del tiempo", pero "controlar x" suele tener la interpretación ceteris paribus, lo que significa que estamos comparando dentro de los grupos con los mismos valores de x. Véase esta respuesta para una buena presentación. Estoy buscando interpretaciones intuitivas y verbales que sean más precisas que "controlar los efectos fijos de la unidad y los efectos fijos del tiempo".
Para ser claros, cuando decimos un efecto fijo unitario en econometría, nos referimos a cualquier determinante observado o no observado de la variable dependiente que sea invariable en el tiempo. Es fácil demostrar que todos ellos son "eliminados" por la degradación a nivel individual. La degradación a nivel individual también controla las diferencias medias de las variables independientes observadas y no observadas entre los individuos. Los efectos fijos individuales en el modelo significan que cualquier fuente de sesgo debe variar en el tiempo . Por lo tanto, si alguien argumenta que su variable es endógena a causa de alguna variable que es constante en su muestra, usted ya ha controlado eso al utilizar únicamente la variación en el tiempo para identificar su estimación puntual.
Así, con la inclusión de estos efectos fijos individuales, puede centrarse en determinar las covariables que varían en el tiempo y que determinan su variable independiente. Los efectos fijos temporales eliminarán cualquier cambio en las variables que sean iguales para todos los individuos en un periodo de tiempo determinado. Por ejemplo, si los "individuos" están agrupados en el mismo estado o municipio, y hay algunos cambios en las políticas estatales o municipales para todos los individuos en ese año, entonces los efectos fijos de tiempo podrían eliminar estos efectos sin necesidad de medirlos. Esto sólo deja la preocupación por las variables que tienen diferentes trayectorias temporales dentro de los distintos individuos.
Así que, tanto con efectos fijos de tiempo como de panel, para identificar el efecto de su variable de interés, dejando a un lado los problemas de exogeneidad, esa variable de interés debe
- sea variable en el tiempo
y
- tienen variación en las trayectorias temporales intraindividuales a través de los individuos (es decir, la heterogeneidad individual, debe estar variando en $it$ no sólo homogénea a través de $i$ en $t$ .)
Por tanto, sí que estamos "controlando" esos factores de confusión no observados invariables en el tiempo, así como las diferencias medias de los factores observados entre los individuos con efectos fijos de panel. De hecho, estamos "controlando" las covariables que tienen una variación común entre los individuos dentro de un año determinado con efectos fijos de tiempo.
Dejemos que $y_{it}=\beta_i+\lambda_t+X_{it}\beta+\epsilon_{it}$ sea la especificación con $i=1\dots N$ y $t=1\dots T$ .
Inicialmente se hace la degradación del panel, que crea la variable transformada
$\overset{..}{y}=(y_{it}-\overline{y_i})=\underbrace{(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)}_\text{panel demeaned time dummies}+\text{other demeaned terms unrelated to year FE}$ .
Esto elimina el $\beta_i$ junto con cualquier otro factor de confusión invariable en el tiempo.
Luego se degrada con el año FE, haciendo la transformación $\overset{...}{y}=\overset{..}{y_i}-\overline{y_t}$ donde $\overline{y_t}=\frac{1}{N}\sum_{j=1}^{N}y_{jt}$ .
$=\underbrace{(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)-\frac{1}{N}\sum_{i=1}^{N}(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)}_\text{want to show this = 0}+\text{other demeaned terms unrelated to year FE}$
. .
desde $\lambda_t$ es común a todos los $i$ en un año determinado, $\sum_{i=1}^{N} \lambda_t=N\lambda_t$ y de forma similar para $\sum_{i=1}^{N}\frac{1}{T}\sum_{j=1}^{T}\lambda_j=N \frac{1}{T}\sum_{j=1}^{T}\lambda_j$
. .
$=(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)-\frac{1}{N}(N \lambda_t -N \frac{1}{T}\sum_{j=1}^{T}\lambda_j)+\text{other demeaned terms unrelated to year FE}$
. .
distribuir el $\frac{1}{N}$
. .
$=\underbrace{(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)-(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)}_\text{=0}+\text{other demeaned terms unrelated to year FE}$
$=\text{other demeaned terms unrelated to year FE}$