3 votos

interpretación: regresiones lineales con variables ficticias de unidad y de tiempo

Supongamos que tengo un panel de datos con N unidades y T períodos de tiempo.

  • Para el modelo 1 con sólo variables ficticias de unidad: $$y_{it} = \text{intercept} + \beta_1 x_{it} + \sum_{j = 2}^{N}\delta_j I\left(i = j\right) + \text{error},$$ estimación por mínimos cuadrados de $\beta_1$ sólo utiliza la variación intra-unitaria a través del tiempo en $x$ .
  • Para el modelo 2 con sólo variables ficticias de tiempo: $$y_{it} = \text{intercept} + \beta_2 x_{it} + \sum_{k = 2}^{T}\gamma_k I\left(t = k\right) + \text{error},$$ estimación por mínimos cuadrados de $\beta_2$ sólo utiliza la variación intra-temporal entre unidades en $x$ .
  • Para el modelo 3 con variables ficticias de unidad y tiempo: $$y_{it} = \text{intercept} + \beta_3 x_{it} + \sum_{j = 2}^{N}\delta_j I\left(i = j\right) + \sum_{k = 2}^{T}\gamma_k I\left(t = k\right) + \text{error},$$ estimación por mínimos cuadrados de $\beta_3$ aparentemente lo hace no utilizar la variación dentro de la unidad dentro del tiempo en $x$ porque no existe tal variación en el conjunto de datos.

Mi pregunta es: ¿cuál es exactamente la variación utilizada en el modelo 3?

Entiendo que para el modelo 3 estamos esencialmente de-meando $x$ y $y$ en formas como $$\tilde{x}_{it} = \left(x_{it} - \bar{x}_i \right) - \left(\bar{x}_t - \bar x \right),$$ donde $\bar {x} _i$ , $\bar {x} _t$ y $\bar {x}$ son la media dentro de la unidad, la media dentro del tiempo y la media total de $x$ .

Los economistas que utilizan el modelo 3 suelen decir vagamente que "han controlado los efectos fijos de la unidad y los efectos fijos del tiempo", pero "controlar x" suele tener el ceteris paribus interpretación, lo que significa que estamos comparando dentro de los grupos con los mismos valores de x. Ver esta respuesta para una buena presentación. Estoy buscando interpretaciones intuitivas y verbales que sean más precisas que "controlar los efectos fijos de la unidad y los efectos fijos del tiempo".

1voto

WMR Puntos 5869

¿cuál es exactamente la variación utilizada en el modelo 3 con las variables de unidad y tiempo tiempo?

La variación que se utiliza para identificar $\beta_3$ es básicamente la desviación a nivel individual de la media individual y de la media de los individuos del año. Por lo tanto, en la medida en que su variable de interés varíe a lo largo del tiempo pero no varíe de forma diferencial entre los individuos, no podrá detectar su efecto.

Los economistas que utilizan el modelo 3 suelen decir vagamente que "han controlado los efectos fijos de la unidad y los efectos fijos del tiempo", pero "controlar x" suele tener la interpretación ceteris paribus, lo que significa que estamos comparando dentro de los grupos con los mismos valores de x. Véase esta respuesta para una buena presentación. Estoy buscando interpretaciones intuitivas y verbales que sean más precisas que "controlar los efectos fijos de la unidad y los efectos fijos del tiempo".

Para ser claros, cuando decimos un efecto fijo unitario en econometría, nos referimos a cualquier determinante observado o no observado de la variable dependiente que sea invariable en el tiempo. Es fácil demostrar que todos ellos son "eliminados" por la degradación a nivel individual. La degradación a nivel individual también controla las diferencias medias de las variables independientes observadas y no observadas entre los individuos. Los efectos fijos individuales en el modelo significan que cualquier fuente de sesgo debe variar en el tiempo . Por lo tanto, si alguien argumenta que su variable es endógena a causa de alguna variable que es constante en su muestra, usted ya ha controlado eso al utilizar únicamente la variación en el tiempo para identificar su estimación puntual.

Así, con la inclusión de estos efectos fijos individuales, puede centrarse en determinar las covariables que varían en el tiempo y que determinan su variable independiente. Los efectos fijos temporales eliminarán cualquier cambio en las variables que sean iguales para todos los individuos en un periodo de tiempo determinado. Por ejemplo, si los "individuos" están agrupados en el mismo estado o municipio, y hay algunos cambios en las políticas estatales o municipales para todos los individuos en ese año, entonces los efectos fijos de tiempo podrían eliminar estos efectos sin necesidad de medirlos. Esto sólo deja la preocupación por las variables que tienen diferentes trayectorias temporales dentro de los distintos individuos.

Así que, tanto con efectos fijos de tiempo como de panel, para identificar el efecto de su variable de interés, dejando a un lado los problemas de exogeneidad, esa variable de interés debe

  1. sea variable en el tiempo

y

  1. tienen variación en las trayectorias temporales intraindividuales a través de los individuos (es decir, la heterogeneidad individual, debe estar variando en $it$ no sólo homogénea a través de $i$ en $t$ .)

Por tanto, sí que estamos "controlando" esos factores de confusión no observados invariables en el tiempo, así como las diferencias medias de los factores observados entre los individuos con efectos fijos de panel. De hecho, estamos "controlando" las covariables que tienen una variación común entre los individuos dentro de un año determinado con efectos fijos de tiempo.

Dejemos que $y_{it}=\beta_i+\lambda_t+X_{it}\beta+\epsilon_{it}$ sea la especificación con $i=1\dots N$ y $t=1\dots T$ .

Inicialmente se hace la degradación del panel, que crea la variable transformada

$\overset{..}{y}=(y_{it}-\overline{y_i})=\underbrace{(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)}_\text{panel demeaned time dummies}+\text{other demeaned terms unrelated to year FE}$ .

Esto elimina el $\beta_i$ junto con cualquier otro factor de confusión invariable en el tiempo.

Luego se degrada con el año FE, haciendo la transformación $\overset{...}{y}=\overset{..}{y_i}-\overline{y_t}$ donde $\overline{y_t}=\frac{1}{N}\sum_{j=1}^{N}y_{jt}$ .

$=\underbrace{(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)-\frac{1}{N}\sum_{i=1}^{N}(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)}_\text{want to show this = 0}+\text{other demeaned terms unrelated to year FE}$

. .

desde $\lambda_t$ es común a todos los $i$ en un año determinado, $\sum_{i=1}^{N} \lambda_t=N\lambda_t$ y de forma similar para $\sum_{i=1}^{N}\frac{1}{T}\sum_{j=1}^{T}\lambda_j=N \frac{1}{T}\sum_{j=1}^{T}\lambda_j$

. .

$=(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)-\frac{1}{N}(N \lambda_t -N \frac{1}{T}\sum_{j=1}^{T}\lambda_j)+\text{other demeaned terms unrelated to year FE}$

. .

distribuir el $\frac{1}{N}$

. .

$=\underbrace{(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)-(\lambda_t-\frac{1}{T}\sum_{j=1}^{T}\lambda_j)}_\text{=0}+\text{other demeaned terms unrelated to year FE}$

$=\text{other demeaned terms unrelated to year FE}$

0 votos

Gracias por la respuesta. Has explicado los efectos fijos de panel y los efectos fijos de tiempo de forma separada/adicional/por pasos, que es lo que me confunde en primer lugar. Denote el conjunto de dummies de panel como $P$ y el conjunto de variables temporales como $Q$ . Lo que has descrito equivale a degradar $Y$ y $X$ dentro del primer panel (dando lugar a $\tilde Y$ y $\tilde X$ ), y luego rebajar $\tilde Y$ y $\tilde X$ dentro del año. Este procedimiento no parece equivalente al modelo 3...

0 votos

El teorema de Frisch-Waugh-Lovell dice que para el modelo 3, podemos proyectar $Y$ , $X$ y $Q$ en $P$ respectivamente, y trabajar con los residuos $\tilde Y$ , $\tilde X$ y $\tilde Q$ . El segundo paso es proyectar $\tilde Y$ y $\tilde X$ en $\tilde Q$ . Este segundo paso parece ser diferente de la degradación dentro del año en el caso escalonado. ¿O tal vez sea lo mismo?

0 votos

Gracias a FWL, el orden de las degradaciones no influye en el resultado final.

1voto

user10775 Puntos 121

Interpretación:

Modelo 1: Dentro de la misma unidad , $y_{it}-y_{is}$ se espera que sea $(x_{it}-x_{is})\beta_1$ . Es decir, dentro de una unidad, entre dos períodos con diferentes $x$ , $y$ se espera que difieran por la diferencia en $x$ veces $\beta_1$ .

Modelo 2: En el mismo periodo , $y_{it}-y_{jt}$ se espera que sea $(x_{it}-x_{jt})\beta_2$ . Es decir, en un período, entre dos unidades con diferentes $x$ , $y$ se espera que difieran por la diferencia en $x$ veces $\beta_2$ .

Modelo 3: Dentro de la unidad $i$ , $y_{it}-y_{is}$ se espera que sea $(x_{it}-x_{is}) \beta_3 + (\gamma_t - \gamma_s)$ y dentro de la unidad $j$ , $y_{jt}-y_{js}$ se espera que sea $(x_{jt}-x_{js})\beta_3 + (\gamma_t - \gamma_s)$ . Así que si $x_{it}-x_{is} = x_{jt}-x_{js}$ entonces las diferencias esperadas en $y$ son los mismos para ambas unidades, y $(y_{it}-y_{is})-(y_{jt}-y_{js})$ se espera que sea $[ (x_{it}-x_{is}) - (x_{jt}-x_{js})] \beta_3$ . ¿Cómo puedo interpretar esta matemática de forma vertiginosa? Permítanme intentarlo, aunque no estoy seguro de que lo consiga. Supongamos que la unidad $i$ 's $x$ difiere en 1 a lo largo de dos periodos, también lo hace la unidad $j$ 's $x$ a través de los mismos dos períodos. Entonces esas dos unidades $y$ se espera que los valores difieran entre los dos periodos en la misma cantidad. Si las dos unidades tienen diferencias en $x$ a lo largo de los dos períodos, entonces las diferencias esperadas en $y$ difieren en $\beta_3$ veces la diferencia en las diferencias de $x$ . Sí, esto es como el DID (diferencia en diferencias).

0 votos

Gracias. ¿Cómo respondería a la pregunta "qué variación se utiliza para estimar $\beta_3$ ?" Lo pregunto porque este tipo de preguntas son frecuentes en los talleres, pero no siempre escucho respuestas satisfactorias.

0 votos

Lo siento, pensé que la pregunta había sido respondida por Hessian y por ti mismo, Paul. Esa es la $\tilde{x}_{it}$ en su pregunta. Debería haber variación en ambos $i$ y $t$ . La tendencia común a lo largo del tiempo se considera que no hay cambios; la variación entre unidades sin variación temporal se considera que no hay nada.

0 votos

Gracias. Estaba tratando de solicitar tu versión. Suena bien.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X