En un intento de evaluar una posible tasa de impuesto sobre las ventas nacional de EE.UU., se sugirió en este foro antes que considere una diferencia en las diferencias en las tasas de impuestos sobre las ventas estatales antes y después de que cambiaron. ¿Cómo podría hacer esto? ¿Podría hacer una diferencia en diferencias en cada uno de los impuestos sobre las ventas de los estados, y luego agregar los datos? Si es así, ¿cómo agrego los datos?
Respuesta
¿Demasiados anuncios?El principal valor de configurarlo como una diferencia distinta en diff frente a utilizar simplemente una variable ficticia para la aplicación de la política es que se puede hacer una comprobación visual de las trayectorias a través del tiempo del grupo tratado (o del objeto tratado) y del no tratado hasta la fecha del tratamiento. Si los dos tienen trayectorias paralelas antes del tratamiento, entonces representan buenas comparaciones diff-in-diff. Los investigadores que trabajan con diff in diff siempre quedarán impresionados con las buenas trayectorias paralelas. Significa que los dos (o los dos grupos) se mueven juntos y que los choques dependientes del tiempo afectan a los grupos de forma similar (no hay choques dependientes del grupo y del tiempo). Entonces tiene una línea vertical en el gráfico que muestra el tiempo del tratamiento y las curvas divergirán (idealmente de forma escalonada o con retraso, a menos que el efecto del tratamiento esté aumentando con el tiempo).
Sin embargo, cualquier diff en diff es técnicamente sólo una regresión con una variable ficticia para el tratamiento (y la variable dependiente que está en un paso de tiempo donde está en el estado tratado tiene un 1 para esa variable ficticia en el RHS), especialmente si usted quiere obtener valores p.
En tu caso tienes múltiples cambios en distintos momentos y de distintas magnitudes, por lo que yo no lo consideraría, ni lo presentaría, como un diifinición (salvo quizás como a continuación). Además de los múltiples estados y tiempos de los cambios, no tienes un tratamiento del tipo "on/off" por lo que no tienes una variable ficticia. Si quiere motivar que tiene buenas comparaciones y ningún problema de endogeneidad, hay una manera de usar cualquier estado que no tuvo cambios durante el período de estudio y dividir los otros estados en grupos para mostrar las trayectorias. (Lo mencionaré más adelante). O incluso crear "comparaciones sintéticas", si quiere ponerse realmente serio y leer sobre ellas. Un estado de comparación sintético se crea utilizando sumas ponderadas de los otros estados, aunque eso es más adecuado para evaluar el impacto en un estado. Un famoso artículo que hizo esto por primera vez utilizó una suma ponderada de los estados de comparación para crear una "California sintética", si quieres googlear eso, y mostró que tenía un comportamiento paralelo e incluso fuera de la muestra en comparación con California, pero ambos todavía antes del cambio. No recuerdo el nombre, probablemente puedas encontrarlo.
El PIB del estado puede ser el LHS, y a la derecha se tiene la desviación de la tasa inicial del impuesto sobre las ventas (del valor inicial para ese estado) como una variable continua. También se incluye la desviación rezagada (aumentos anteriores del impuesto sobre las ventas, cambio de uno y dos años anteriores al año del estado que se está considerando. La otra ventaja es que se puede incluir cualquier observable en la regresión.
Así pues, y_t = PIB del año t = a + beta*(aumento del tipo impositivo desde el valor del año cero) + beta2*(aumento del año t-1 desde el valor del año cero) + beta3*(aumento del año t-2 desde el valor del año cero) + otras cosas.
Si se encuentra en una universidad o institución de alto nivel, o incluso snob, que se niega a aceptar los "corredores de regresión" alegando que no puede controlar las variables no observables y no sabe si tiene problemas de endogeneidad, puede dividir el período de estudio en partes. Por ejemplo: un grupo tuvo cambios en los años 7-10, pero no en los años 0-7 u 11-15, y un grupo no tuvo aumentos en los años 0-15 (clasifíquelo así e ignore a los que no encajen en ninguno de los dos grupos). Trace la media del PIB de cada grupo de los años 0-7 para mostrar buenas comparaciones (trayectorias paralelas) y enfatice que esto muestra que no tenemos ningún choque dependiente del tiempo, dependiente del grupo, que desvíe las estimaciones. A continuación, añada el resto de los años, con los años 7-10 como líneas de puntos para las dos curvas, o una banda gris, ya que se trata de un tiempo de transición. El cambio (con suerte un paso o un paso retrasado) entre los grupos muestra visualmente el efecto del impuesto sobre las ventas. Usted sigue haciendo las regresiones y sólo utiliza los coeficientes de eso; todo lo demás es sólo para mostrar que los coeficientes están midiendo lo que usted dice que son. Voy a responder a cualquier pregunta si Im alrededor de esto puede ser confuso.
Una versión mucho más sencilla y mucho menos precisa utilizaría los estados que no tienen impuesto sobre las ventas, si es que existen suficientes, pero sigue existiendo el problema de los diferentes años de aplicación. Si tuvieras tres estados de este tipo podrías hacer tres pruebas de diferencia en diferencia totalmente separadas. Hágame saber si usted tiene una situación tan improbable.