Estoy realizando un análisis de diferencia en diferencias de un evento que afectó varios estados en los EE. UU. Estoy interesado en entender los efectos de este evento en las tasas de desempleo a nivel estatal. Tengo datos a nivel estatal sobre demografía para varios años antes y después de este evento. Mi pregunta es qué covariables debo incluir si estoy estimando la ecuación de la siguiente forma:
$$ \mbox{tasaDesempleo}_{jt} = \gamma_j + \alpha_t + \beta D_{jt} + \delta X_{jt} + \epsilon_{jt} $$
donde $\gamma_j$ son efectos fijos por estado; $\alpha_t$ son efectos fijos por tiempo; $D_{jt}$ son variables dummies - 1 si el estado $j$ es afectado en el tiempo $t$, y 0 en caso contrario; y $X_{jt}$ son covariables a nivel estatal que varían con el tiempo. El coeficiente de interés es $\beta$.
Hasta ahora, he incluido la población y el ingreso promedio de los hogares a nivel estatal.
¿Qué otras covariables puedo incluir? ¿Cómo decide uno qué covariables incluir en un escenario como este? ¿Cuál es la filosofía guía?
0 votos
Las covariables deben ser pre-determinadas
0 votos
@Papayapap, ¿podrías aclarar con algunos detalles? ¿Cómo se 'pre-determina'?
1 votos
No deben ser afectados por el tratamiento, ya sea medidos antes o invariables.
0 votos
El ingreso promedio de los hogares podría ser fácilmente argumentado que se ve afectado por el tratamiento bajo la suposición de que el tratamiento tiene un efecto distinto de cero en la tasa de desempleo. Sin embargo, variables que describan la calidad de la fuerza laboral podrían ser una sugerencia. Tal vez algo como el nivel educativo promedio, la participación de grupos educativos, el grado de urbanización/variables de acceso al mercado laboral (área de tierra por habitantes con una densidad de carreteras mayor que x ... o algo así). Los inmigrantes pueden tener dificultades para lograr una integración total en el mercado laboral, por lo que es importante tener en cuenta la participación de cierto tipo de inmigrantes.
0 votos
@JesperHybel, gracias. ¿Cuál es la filosofía general que guía la elección de una covariable en particular? Estoy tratando de encontrar una referencia sobre esta pregunta, pero hasta ahora no he tenido suerte.
0 votos
En la medida en que existan 'reglas generales' que guíen la elección de variables, estas se encuentran en la literatura económica sobre el tema en cuestión. Esta literatura es tanto teórica como empírica. Estás llevando a cabo un análisis empírico a nivel estatal. Existe una larga tradición de hacerlo y solo leyendo esta literatura o revisiones (quizás de longitud de libro) encontrarás lo que estás buscando. Como dice @Papayapap: Debes establecer la predeterminación de tus variables, sin embargo, para argumentar a favor de la predeterminación tendrías que usar teoría económica.
0 votos
Por ejemplo, vea este pasaje de Angrist abordando la estimación de los retornos a la educación: 'Aunque la ocupación está fuertemente correlacionada tanto con la escolaridad como con los salarios, los indicadores de ocupación son malos controles en las regresiones destinadas a capturar los efectos causales de la escolaridad en los salarios. El hecho de que el Maestro Joshway trabaje hoy como profesor y no como asistente de enfermería (como una vez lo hizo) es en parte una recompensa por su extravagante educación. Es un error eliminar este beneficio de nuestro cálculo al comparar solo profesores o asistentes de enfermería cuando intentamos cuantificar el valor económico de la educación.'
0 votos
Si deseas realizar un análisis a nivel estatal en un moderno diff-in-diff, te recomendaría leer algo de Alberto Abadie. Puedes comenzar aquí: economics.mit.edu/sites/default/files/publications/…. No estoy diciendo que esto responderá tus preguntas, pero en mi opinión, es una interesante nueva investigación metodológica.
0 votos
Puede encontrar tutoriales y guías sobre la implementación en la literatura que documenta el software en R. Los paquetes R relevantes se llaman 'synth' y 'tidysynth': Aquí hay algo sobre synth: jstatsoft.org/article/view/v042i13
0 votos
Personalmente, también me gusta esta página: diff.healthpolicydatascience.org y theeffectbook.net/ch-DifferenceinDifference.html como introducción, pero realmente hay tanta literatura metodológica siendo escrita sobre diff-in-diff. Y aquí está una página que intenta dar una visión general de los desarrollos en diff-in-diff: asjadnaqvi.github.io/DiD
0 votos
@JesperHybel, gracias por estas referencias.