3 votos

¿Cómo justificar los grupos de tratamiento y control para la diferencia en la diferencia con la aplicación escalonada de las leyes?

A. Antecedentes:

Dong, 2019 y Dasgupta, 2019 se utilizaron de la misma manera para generar los grupos de tratamiento y de control porque todos ellos aprenden sobre el impacto de las mismas leyes en diferentes variables dependientes. Recuperé la información sobre cómo Dasgupta, 2019, p. 2596-2597 crear su muestra como se indica a continuación:

La identificación de la línea de base:

$Y_{it}$ = $\alpha$ + $\beta$ $(Leniency Law)_{kt}$ + $\delta$$ X_{ikt}$ + $\theta$$ _t$ + $\gamma$$ _i$ + $\epsilon$$ _{it}$ (1)

donde $i$ , $k$ y $t$ empresas, países y años del índice, respectivamente. $X_{ikt}$ es un vector de los diferentes controles de la empresa, el país y la industria, mientras que $\gamma$ y $\theta$ son efectos fijos de empresa y año.

La variable de interés aquí es $(Leniency Law)_{kt}$ . Dasgupta, 2019, p. 2597 documentado que esta variable es igual a 0 antes de la aprobación de la ley de clemencia en el país $k$ y 1 después. Siguen un enfoque estándar de diferencias en diferencias con aplicación escalonada de las leyes ( Bertrand, 2003 ) para construir el grupo de tratamiento y de control.

B. Descripción del autor:

Dasgupta, 2019, p. 2597 dijo que

el grupo tratado comprende todas las empresas con sede en países que han aprobado una ley de clemencia en el año t. El control grupo comprende empresas de países que nunca se adoptó a de clemencia en el período de la muestra y las empresas con sede en países que adoptó una ley de clemencia en algún momento posterior .

C. Discusión:

  1. Si el grupo de control incluye empresas de países que aplicaron esta ley en algún momento anterior en el tiempo ? Lo que yo entiendo es: por ejemplo, de Tabla 2, Dasgupta, 2019, p. 2599 En el caso de Corea, las leyes se aprobaron en 1997, por lo que el grupo de control incluye a todas las empresas de todos los países que no aplicaron esta ley entre 1995 y 2002, incluido Estados Unidos. Desde mi punto de vista, este debería ser el caso porque, basándose en esta identificación, las empresas de EE.UU. no se verán afectadas por las leyes aprobadas en Corea, por lo que estas empresas estadounidenses de 1995-1996 y 1998-2002 pueden ser observaciones de control para Corea. Pero si este es el caso, por qué tienen que escribir "adoptó una ley de clemencia en algún momento posterior" ? Porque en el caso de Corea, la palabra "nuestro período de muestra" ya significa "1995-2002".

  2. ¿Significa esto que sólo $(Leniency Law)_{kt}$ del grupo de tratamiento tras la aprobación de las leyes recibió un valor de 1? Además, el grupo de control y el grupo de tratamiento antes de la aprobación de las leyes reciben un valor de 0?

  3. Imaginemos dos casos: (1) Tanto Alemania como Brasil aplicaron esta ley en el año 2000 y (2) Sólo Alemania aplicó esta ley en el año 2000. Entonces, ¿el número de observaciones de los grupos de control para estos dos casos es idéntico?

  4. Australia y Bélgica aprobaron la ley en 2003 y 2004, respectivamente. Entonces, ¿las empresas de Malasia sólo existen una vez en la muestra de control? Es decir, si una observación puede ser el control de muchos tratamientos en este escenario de DiD? (lo que significa que no hay observaciones de control duplicadas).

  5. Arriba está cómo agrupó el control y el tratamiento en base a su identificación, pero en la página 2600, Dasgupta, 2019, sección 3.1 dice que "las empresas de control son todas las empresas del mismo sector en países que no han aprobado una ley de clemencia en los 7 años que rodean la fecha del evento". Esta identificación me confundió porque ahora tenemos una dimensión más sobre la industria. Me pregunto por qué no lo pusieron en la identificación de la línea de base sino en la sección de resultados. ¿Cuál es la razón de ello?

4voto

toros Puntos 431
  1. ¿Por qué tienen que escribir "adoptó una ley de clemencia en algún momento posterior"? Porque en el caso de Corea, la palabra "nuestro período de muestra" ya significa "1995-2002".

Suponiendo que Corea sea el país pionero, todos los países no tratados antes de 1997 pueden servir de contrafactualidad. Esto incluye a los países que nunca adoptaron una ley de clemencia y aquellos con periodos de adopción de tratamientos inminentes.

  1. ¿Significa esto que sólo $()_{}$ del grupo de tratamiento tras la aprobación de las leyes recibió un valor de 1? Además, el grupo de control y el grupo de tratamiento antes de la aprobación de las leyes reciben un valor de 0?

Correcto.

La variable binaria de tratamiento en este escenario más general no es la misma variable que en el caso "clásico" de diferencias en diferencias. Supongamos que todas las empresas de los países tratados adoptan una ley de clemencia en el año 2000. En este caso, se podría escribir esta ecuación de forma más sencilla como la interacción entre una variable ficticia de tratamiento y control y un indicador post-tratamiento igual a 1 después de la entrada en vigor de la ley en ambos grupos 0 en caso contrario. Sin embargo, una vez que nos alejamos de este escenario y el despliegue del tratamiento es escalonado o incluso se activa y desactiva a lo largo del tiempo, entonces la variable "post-tratamiento" ya no está bien definida. Para proceder, debemos utilizar el estimador de diferencias en diferencias "generalizado", que define el término del producto de forma diferente.

En la ecuación a la que hace referencia, el término de interacción está implícito en la codificación de $LL_{kt}$ (es decir, la ley de clemencia). Es igual a 1 en todas las empresas que tienen su sede en países que han aprobado una ley de clemencia en el año $t$ 0 en caso contrario. Imagina que tienes una columna de ceros. Introduzca un valor de 1 cuando las empresas del país $k$ adoptar por año $t$ 0 en caso contrario. Así, cualquier país que nunca adopte una ley de clemencia se deja como 0 para todo el periodo de observación.

  1. Imaginemos dos casos: (1) Tanto Alemania como Brasil aplicaron esta ley en el año 2000 y (2) Sólo Alemania aplicó esta ley en el año 2000. Entonces, ¿el número de observaciones de los grupos de control para estos dos casos es idéntico?

Desde la perspectiva de este estimador, la variable de tratamiento $LL_{kt}$ no distingue entre grupos de tratamiento y de control. Sólo tenemos países $k$ cambio en sus pólizas por año $t$ . Cualquier país $k$ no adoptar nunca una ley de clemencia es igual a 0 en todos los $t$ .

Supongamos que un panel va de 1995 a 2002. En el ejemplo (A), tanto Alemania como Brasil se "encenderán" (es decir, pasarán de 0 a 1) en el año 2000 y permanecerán encendidos. Por lo tanto, Brasil y Alemania tienen 5 períodos de tiempo antes y 3 después del tratamiento. Tienen historiales de tratamiento "idénticos". Los países que nunca adoptan la nueva ley servirían de contrafactual.

En el escenario (B) sólo las observaciones dentro del grupo en Alemania se encenderían en el año 2000, mientras que las observaciones dentro del grupo en Brasil serían todas iguales a 0. Los países que nunca adoptaron la nueva ley, entre los que se encuentra Brasil, servirían de contrafactual.

  1. Australia y Bélgica aprobaron la ley en 2003 y 2004, respectivamente. Entonces, ¿las empresas de Malasia sólo existen una vez en la muestra de control? Es decir, si una observación puede ser el control de muchos tratamientos en este escenario de DiD?

Sí.

Supongamos que Malasia no adopta nunca una ley de clemencia. Las empresas malayas pueden servir de contrafactual para las australianas y Las empresas belgas hasta los periodos de tiempo en los que se tratan. En otras palabras, el sector de Malasia es un contrafactual para el y tardíos antes de cada uno de sus respectivos periodos de exposición.

El siguiente marco de datos muestra cómo codificamos $LL_{kt}$ en la práctica. Hay que tener en cuenta que esto es un poco diferente, ya que sólo vemos las observaciones de un año del país. Supongo, basándome en mi somera revisión del documento, que las leyes de clemencia afectan a todas las empresas de cada país. Si es así, y los autores observan todas las empresas antes de y tras la entrada en vigor de las leyes, entonces podemos estimar la ecuación a nivel de empresa o a nivel nacional.

Para simplificar, el marco de datos ficticio que se presenta a continuación observa tres países entre 2000 y 2006. Alemania adopta la ley desde el principio; $LL_{kt}$ pasa de 0 a 1 en 2003 y se mantiene. Australia lo adopta tarde; $LL_{kt}$ pasa de 0 a 1 en 2005 y se mantiene. El mercado malayo nunca adopta una ley de clemencia . Observe cómo $LL_{kt}$ es 0 para todo el período de observación. Si también observamos las empresas $i$ a lo largo del tiempo dentro de las industrias malayas, entonces todas las empresas deberían ser codificadas como 0 en cada período de empresa-año.

De nuevo, la variable $LL_{kt}$ no delimita un subconjunto específico de empresas/países tratados o no tratados, sino que simplemente "activa" (es decir, pasa de 0 a 1) si una jurisdicción fue tratada y sólo durante los períodos $t$ cuando la ley estaba realmente en vigor, 0 en caso contrario.

El siguiente marco de datos debería ayudar a su intuición:

$$ \begin{array}{ccc} country & year & LL_{kt} \\ \hline \text{Malaysia} & 2000 & 0 \\ \text{Malaysia} & 2001 & 0 \\ \text{Malaysia} & 2002 & 0 \\ \text{Malaysia} & 2003 & 0 \\ \text{Malaysia} & 2004 & 0 \\ \text{Malaysia} & 2005 & 0 \\ \text{Malaysia} & 2006 & 0 \\ \hline \text{Germany} & 2000 & 0 \\ \text{Germany} & 2001 & 0 \\ \text{Germany} & 2002 & 0 \\ \text{Germany} & 2003 & 1 \\ \text{Germany} & 2004 & 1 \\ \text{Germany} & 2005 & 1 \\ \text{Germany} & 2006 & 1 \\ \hline \text{Australia} & 2000 & 0 \\ \text{Australia} & 2001 & 0 \\ \text{Australia} & 2002 & 0 \\ \text{Australia} & 2003 & 0 \\ \text{Australia} & 2004 & 0 \\ \text{Australia} & 2005 & 1 \\ \text{Australia} & 2006 & 1 \\ \end{array} $$

Tenga en cuenta que antes de que Alemania adopte un estatuto de clemencia en 2003, su historia contrafactual es la de Malasia y Sectores australianos. También cabe destacar que Los países tratados anteriormente también pueden servir de contrafactuales para los países de adopción tardía . En otras palabras, cuando Australia adopte una ley de clemencia más adelante en 2005, las empresas malayas (es decir, las no adoptadas) y las empresas alemanas (es decir, las que se adoptaron pronto) pueden aproximarse a su historia contrafactual. Este estimador está promediando todas las posibles estimaciones de diferencias en diferencias 2x2.

Los inconvenientes de este estimador pueden ser objeto de un debate aparte. Pero abordemos brevemente una preocupación. Por ejemplo, el modelo asume la ausencia de efectos variables en el tiempo. Por ejemplo, se supone que el efecto de una ley de clemencia en la trayectoria de los resultados de Alemania es instantáneo y constante. Esta suposición es tenue y difícil de defender estadísticamente. Obsérvese que seguimos asumiendo una "tendencia común" en todos los grupos antes de sus períodos de exposición. Imaginemos un escenario en el que la tendencia de los resultados de Alemania cambiara con el tiempo después de 2003. Una vez que Australia pasa a la condición de tratamiento en 2005, la trayectoria de resultados de Alemania puede verse compensada por su exposición anterior. Cuando se permite que los países "ya tratados" actúen como controles de los países "que pronto serán tratados", los cambios en sus efectos de tratamiento a lo largo del tiempo se restan de la estimación de la diferencia en diferencias. Así, mientras que el estimador de efectos fijos bidireccionales produce un media ponderada de los efectos del tratamiento en todos los grupos y momentos: algunas de las ponderaciones pueden ser negativas. La ponderación negativa sólo surge en presencia de efectos de tratamiento heterogéneos. Lea esto documento de trabajo para saber más sobre este tema.

  1. Arriba es cómo agrupó el control y el tratamiento en base a su identificación, pero en la página 2600, Dasgupta, 2019, sección 3.1 dijo que "las empresas de control son todas las empresas de la misma industria en los países que no habían aprobado una ley de clemencia en los 7 años que rodean la fecha del evento". Esta identificación me confundió porque ahora tenemos una dimensión más sobre la industria. Me pregunto por qué no lo pusieron en la identificación de la línea de base sino en la sección de resultados. ¿Cuál es la razón de ello?

Tengo entendido que el cronometraje de las leyes de clemencia no varía entre los distintos sectores, pero no puedo estar seguro hasta que no lea detenidamente el documento.

Por lo general, los autores pueden especificar un modelo base y luego ampliarlo en su sección de resultados. Por ejemplo, pueden informar de los coeficientes de adelanto/retraso en forma de tabla pero sin mostrar explícitamente su ecuación. Los autores también pueden probar una serie de especificaciones alternativas, como incluir los efectos de la industria por año, aunque este término se haya excluido de su ecuación empírica principal.

1voto

user2008800 Puntos 6

Creo que los términos "grupo de tratamiento" y "grupo de control" son, en el mejor de los casos, una analogía poco precisa en un modelo econométrico con efectos fijos bidireccionales y adopción escalonada del grupo de tratamiento. En resumen, creo que tienes razón al ser escéptico sobre el uso de los términos "grupo de tratamiento" y "grupo de control" aquí. Creo que los autores los utilizan de una manera menos precisa o rigurosa para dar una intuición general de la estrategia de identificación por medio de una analogía con un ensayo aleatorio o una diferencia en diferencias no escalonada.

En realidad, hay una literatura bastante grande y reciente sobre cuestiones econométricas que están de alguna manera relacionadas con esto, especialmente en los casos en que el efecto del tratamiento no es uniforme. Si se busca "difference in differences" en Twitter se puede aprender mucho al respecto.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X