Estoy trabajando en el análisis de datos experimentales para un proyecto de tesis. Los datos consisten en sujetos que realizan la misma tarea durante cinco rondas, y estoy interesado en la diferencia de tendencias entre los sujetos de dos tratamientos diferentes. Los dos tratamientos son idénticos hasta la tercera ronda.
Tenía previsto utilizar un modelo diff-in-diff para estimar la diferencia de los niveles de esfuerzo de los sujetos en estos tratamientos. El problema es que tengo cinco rondas, dos de las cuales son antes del tratamiento y tres después del tratamiento. Actualmente, estoy utilizando esta especificación, pero no estoy seguro de si es correcta:
$$ Effort_{it}=\beta _{0} + \beta_{1}Treatment_{i}+\sum_{n=2}^{5}\beta _{n}Roundn_t+\beta_6Treatment*After_{it} $$
Donde tratamiento es una variable ficticia para estar en el grupo de tratamiento, Rondan es una variable ficticia para estar en la Ronda N, y Tratamiento*Después es una variable ficticia de interacción para estar en el grupo de tratamiento después de la ronda 2 (cuando el tratamiento "comienza").
Estoy confundido sobre todo en cuanto a qué hacer con los diferentes períodos de tiempo. ¿Sería mejor usar dummies para cada ronda como arriba, o simplemente incluir una variable de Ronda que es igual al número de la ronda. ¿También debería incluir sólo un término de interacción, o uno para cada ronda?