Fondo
Lo típico es inspeccionar visualmente las tendencias previas al tratamiento de los grupos de control y de tratamiento. Lo quieras o no, puedes estar sesgado al observar la representación visual. Yo diría que un estudiante universitario medio afirmaría que ni el control 1 ni el 2 superan el supuesto de "tendencia paralela". Al mismo tiempo, muchos investigadores realizan una inspección visual más relajada, dado que usted explica la teoría y los argumentos que apoyan las tendencias paralelas previas al tratamiento. Esto, por supuesto, causa cierta fricción, por ejemplo, mire a Kearney y Levine (2015) y Jaeger, Joyce y Kaestner (2018), y luego otra vez Kearney y Levine (2018) .
Metodología matemática
Es posible comprobar la hipótesis de la tendencia paralela de forma más concisa. Este ofrece una buena introducción sobre cómo hacerlo.
Una prueba formal que también es adecuada para tratamientos multivaluados o varios grupos consiste en interactuar la variable de tratamiento con variables ficticias temporales. Supongamos que tenemos 3 periodos pretratamiento y 3 periodos postratamiento. $$y_{it} = \lambda_i + \delta_t + \beta_{-2}D_{it} + \beta_{-1}D_{it} + \beta_1 D_{it} + \beta_2 D_{it} + \beta_3 D_{it} + \epsilon_{it}$$ donde $y$ es el resultado del individuo $i$ a la vez $t$ , $$ et $$ son efectos fijos individuales y temporales (se trata de una forma generalizada de escribir el modelo diff-in-diff que también permite múltiples tratamientos o tratamientos en diferentes momentos).
La idea es la siguiente. Se incluyen las interacciones de las variables ficticias y el indicador de tratamiento para las dos primeras variables previas al tratamiento. y se omite la interacción para el último periodo de debido a la trampa de la variable ficticia. Además, ahora todas las otras interacciones se expresan en relación con el periodo omitido, que que sirve de referencia. Si las tendencias de los resultados entre el grupo de tratamiento y grupo de control son las mismas, entonces $_{2}$ y $_{-1}$ debe ser insignificante, es decir, la diferencia de diferencias no es significativamente diferente entre los dos grupos en el periodo anterior al tratamiento.
¿Qué hacer?
Presente siempre un gráfico que muestre los niveles de las dos series que está comparando a lo largo del tiempo, no sólo su diferencia. La regla general es preferir DiD sobre una muestra emparejada por este motivo: si consigues que los niveles sean más parecidos, los lectores estarán más dispuestos a pensar que las tendencias también lo serán.
Kahn-Lane y Lang (2019) sobre el "fracaso para rechazar tendencias paralelas en los datos previos al tratamiento".
Cada vez más, los investigadores señalan una prueba de pre-tendencia estadísticamente insignificante para argumentar que, por lo tanto, aceptan la hipótesis nula de tendencias paralelas. No cabe duda de que la prueba de una tendencia previa común desempeña un papel importante en la validación de la hipótesis de tendencias paralelas subyacente a la DiD. Sin embargo, no rechazar que los resultados de los años anteriores al tratamiento muestran tendencias paralelas no debe confundirse con establecer la validez de la contrafactual de tendencias paralelas. Además, es evidente que no rechazar la hipótesis nula no equivale a confirmarla.
Pero también, y en mi opinión, más importante, Kahn-Lane y Lang (2019) señalan que:
Los autores deben realizar una comparación exhaustiva de las diferencias entre los grupos de tratamiento y de control, incluyendo la composición demográfica, otros factores que podrían haber afectado de forma diferencial a cada grupo y la comparación de tendencias tan atrás como sea posible .
Relajar la tendencia paralela con el método de control sintético
Suponiendo que el número de periodos previos a la intervención sea lo suficientemente grande, es probable que los factores de confusión no observados y variables en el tiempo tengan efectos similares tanto en la unidad tratada como en el homólogo sintético (Kreif et al., 2016). En su caso, el método de control sintético podría mejorar el enfoque DiD al relajar el supuesto de tendencias paralelas. Sin embargo, cuanto más largos sean los datos previos al tratamiento, mejor. Además, con el DiD a menudo existe una especie de ambigüedad en lo que respecta a la elección del grupo de control, como argumenta Card (1989); en el caso del MCE, se elige mediante un método basado en datos.
Si desea leer más sobre el Método de Control Sintético, le recomiendo encarecidamente que acuda a la fuente, es decir, Abadie et al. (2010), Abadie et al. (2011) y Abadie et al. (2015). La aplicación del MCE para estimar los efectos del tratamiento en entornos de panel se ha hecho muy popular entre los investigadores interesados en estudios de casos comparativos. Desde entonces, el MCE se aplicó en varios campos y a diversos temas de investigación, estableciendo una alternativa intuitiva a la creación de contrafactuales. Según Athey e Imbens (2017):
El Método de Control Sintético es posiblemente la innovación más importante en la evaluación de políticas política de los últimos 15 años.
Por lo tanto, el uso de SCM como comprobación de la solidez de DiD está más que justificado.