Sí, puede ejecutar diff-in-diff con tratamiento agregado en este caso.
Sí, los errores estándar deben ser agrupados en el nivel de tratamiento (aquí=estado).
No, la cantidad de grupos no es un problema, ya que el número relevante es el número total de grupos y 50 debería evitar razonablemente el problema de los grupos pequeños.
La forma en que puedes pensar en esto es olvidar la existencia de estados. Simplemente tienes algunas observaciones (empresas) tratadas y otras que no lo están. En principio, eso te da diff-in-diff si puedes cumplir con todas las suposiciones sobre el grupo de control (comportamiento similar en ausencia de tratamiento).
Sin embargo, surgen tres problemas generales adicionales.
-
Lo ideal en este caso sería también mostrar resultados a nivel de tratamiento agregado, lo que no puedes hacer debido al sesgo de muestra pequeña, ya que eso te da solo 50 observaciones en cada periodo de tiempo, pero está bien.
-
Encontrar las unidades/estados de control correctas (cumpliendo con suposiciones, p. ej., tendencias paralelas) es difícil. El hecho de que solo un estado esté tratado puede significar que ese estado es muy único en el contexto de tu pregunta de investigación. Tal vez quieras usar emparejamiento de puntaje de propensión o control sintético además de diff-in-diff.
-
Los tratamientos a nivel estatal pueden ser muy generales y necesitas asegurarte de que no estén ocurriendo otras políticas divergentes, etc.
Dicho esto, este tipo de análisis se pueden realizar y a menudo se hacen. Recomiendo encontrar un artículo que haga diff-in-diff con tratamiento a nivel estatal y seguir sus pasos para comenzar.