Entiendo que el coeficiente del término de interacción en un modelo estándar de diff-in-diff es el efecto promedio del tratamiento en los tratados (ATT). Pero me preguntaba cómo/cuándo podemos derivar el efecto promedio del tratamiento (ATE) de una regresión diff-in-diff.
Respuesta
¿Demasiados anuncios?No estoy seguro, pero ATE no parece estar identificado bajo la suposición de tendencias paralelas para los resultados potenciales no tratados porque ATU no lo está. Aquí está el por qué.
Primero, mostremos que ATU debe ser identificado para que ATE sea identificado cuando ATT lo sea. Esta parte es directa porque \begin{align} ATE &= E(y^1 - y^0)\\ &= E(y^1-y^0|d=1)P(d=1) + E(y^1-y^0|d=0) P(d=0)\\ &= ATT\cdot P(d=1) + ATU \cdot P(d=0), \end{align} donde ATT está identificado por DID (como menciona OP, bajo la suposición de tendencias paralelas para $y^0$) y $P(d=1)$ y $P(d=0)$ están obviamente identificados. Así que ATE está identificado si y solo si ATU está identificado a menos que $P(d=0)\ne 0$, lo cual es cierto. Por lo tanto, la pregunta es si ATU está identificado por una regresión DID.
Para esta segunda pregunta, tenemos $$ATU = E(y^1 - y^0|d=0) = E(y^1|d=0) - E(y|d=0),$$ donde $E(y|d=0)$ está obviamente identificado. Sin suposiciones sobre $E(y^1|g,t)$, es imposible identificar $E(y^1|d=0)$. Por lo tanto, con tendencias paralelas solo para $y^0$, ATU permanece no identificado, y correspondientemente ATE está no identificado.
Entonces, ¿qué sucede si se supone tendencias paralelas para los resultados potenciales tratados $y^1$? Bueno, en ese caso, ATU debería estar identificado pero ATT y ATE no lo están.
La conclusión es que identificar ATE requiere algunas suposiciones sobre tanto $y^0$ como $y^1$. Este es mi razonamiento. ¿Qué piensas?