2 votos

Diff-in-diff con diferentes años de tratamiento, ¿cuál sería la variable dummy de tiempo para el control?

Quiero estimar el impacto que tienen las réplicas en las citas. Para ello, quiero hacer un diff-in-diff escalonado, comparando los papers replicados vs los no replicados.

En mi conjunto de datos tengo alrededor de 80 papers que fueron replicados (por lo tanto, mi grupo de tratamiento), y 160 que nunca fueron replicados. Para garantizar la comparabilidad, solo tomé papers empíricos que fueron publicados en las mismas revistas, volúmenes, números y sobre los mismos temas o códigos JEL.

Mis datos se ven algo así: Ejemplo de conjunto de datos

Mi supervisor sugirió comenzar con un diff-in-diff "simple", para ver algún efecto inicial y luego proceder a hacer la versión escalonada (y probablemente una regresión de Poisson ya que mi variable dependiente es un número de conteo no negativo).

Para el diff-in-diff, mi dummy de tratamiento es "replicado", que es 1 para los papers replicados y 0 para el resto. Y mi problema/pregunta es con mi dummy de tiempo d_time, porque: como puedes ver, mis observaciones tratadas tienen diferentes años de tratamiento. En este ejemplo, uno fue tratado en 2021 y otro en 2018. Pero tengo 80 papers que fueron replicados en total, por lo que cada uno fue replicado en diferentes años. Entonces, hay un antes y un después para el grupo de control, pero no hay un antes y un después específicos para todo el tratamiento, así que no sé contra qué comparar.

¿Sería correcto que mi dummy de tiempo d_time tome los valores de 0 para todos mis control? Sin embargo, creo que es por esto que obtengo colinealidad en mis primeros resultados:

Resultados iniciales

¿Estoy haciendo algo completamente mal? ¿Alguien podría iluminarme un poco? Soy muy nuevo en esto, pido disculpas si no es claro pero espero que lo sea.

EDICIÓN

El "simple" Diff-in-Diff sugerido se vería algo así: ecuación

¿Sería correcto para el grupo de control (replicado=0), tener un 0 en la columna post_rep? mientras que solo el grupo tratado (replicado=1) tiene 0 y 1? ¿Tendría sentido realizar tal análisis?

2voto

user10287 Puntos 61

Supongamos que tienes un conjunto de datos $\{Y_{it},X_{it},D_{it}\}$ donde $Y_{it}$ es la variable dependiente, $X_{it}$ son variables de control y $D_{it}$ es un indicador que para la unidad observacional $i$ es igual a $1$ para todo $t \geq t^\star_i$ y $0$ para todo $t, donde $t^\star_i$ es el período de tiempo en el que la unidad $i$ recibe tratamiento.

Luego asumimos que no habría abandono del tratamiento después de recibirlo (en la literatura de diferencia en diferencias esto se conoce como que el tratamiento es un estado absorbente).

En la diferencia en diferencias simple tienes un grupo de control que nunca recibe tratamiento $D_{it}=0$ para todo $t$ para todos $i \in \mathcal G_c$ donde $\mathcal G_c$ es el grupo de unidades observacionales en el grupo de control. Y un grupo $\mathcal G_{t^\star}$ de unidades observacionales que reciben tratamiento en el tiempo $t^\star$.

En este caso puedes simplemente regresarlo,

$$(1) \ \ \ Y_{it} = \delta_t + \mu_g + \lambda D_{it} + \beta X_{it} + \epsilon_{it},$$

donde $\delta_t$ son efectos fijos en el tiempo y $\mu_g$ son efectos fijos de grupo.

Ayudaría si jugaras con estos simples setups de diferencia en diferencias. Esto te dará una idea de cómo se comportan los datos. Además, te permitirá experimentar con la construcción de $\mathcal G_c$ de diferentes maneras.

Puedes estimar perfectamente la ecuación (1) con varios grupos que reciben tratamiento en diferentes momentos. No hay ninguna variable post_rep cuya definición dependa de la no ambigüedad del momento del tratamiento. En su lugar, la especificación utiliza constantes de tiempo.

Sin embargo, estimar (1) ha sido criticado en una nueva línea de literatura de diferencia en diferencias. La especificación impone que (a) todas las unidades tengan el mismo efecto del tratamiento, y (b) el tratamiento tenga el mismo efecto independientemente de cuánto tiempo ha pasado desde que comenzó el tratamiento. Puedes echar un vistazo a este documento de revisión:

¿Qué es tendencia en Diferencia en Diferencias? Una síntesis de la reciente literatura en econometría

Estas diapositivas explican una diferencia en diferencias simple 2x2 y luego pasan a la literatura sobre diferencia en diferencias escalonada

Diapositivas de diferencia en diferencias

La historia corta es que no puedo decirte qué hacer si no aceptas las suposiciones (a) y (b) porque en ese caso hay múltiples formas de avanzar. Sin embargo, la forma más sencilla de permitir la heterogeneidad del tratamiento es simplemente ejecutar especificaciones de diferencia en diferencias simples para los diferentes grupos tratados cuyo tratamiento crees que es diferente.

Siempre puedes plantear una nueva pregunta una vez que hayas dominado los conceptos básicos.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X