He hojeado las diapositivas que has enlazado.
Creo que el profesor Haile en estas diapositivas está tratando de introducir los conceptos de modelos "estructurales" y "de forma reducida" en un sentido muy amplio.
Sin embargo, a lo largo de las últimas 5 ó 6 décadas de desarrollo de la literatura econométrica, el significado exacto de las palabras "estructural" y "de forma reducida" ha cambiado ligeramente, dependiendo de los modelos o formas de modelización de que se trate.
Y si estos términos se emplean de forma no cualificada, la confusión está asegurada.
Bien. Para entender realmente estos términos, volvamos primero a la modelos de ecuaciones simultáneas (SEM) .
Por supuesto, la idea del SEM se remonta al menos a Marshall. El estudio econométrico del SEM es también muy antiguo, y se remonta al menos a Tinbergen. (No me cites, no soy un historiador del pensamiento económico).
Por ejemplo, el precio y la cantidad en un mercado pueden analizarse mediante dos ecuaciones $P = F_P(Q, Z, e_P)$ y $Q = F_Q(P, Z, e_Q)$ . Aquí, $Z$ son variables exógenas fuera del ámbito del modelo. $e_P$ y $e_Q$ son variables no observadas que aparecen en las ecuaciones de precios y cantidades, respectivamente.
Estas dos ecuaciones se denominan simultáneamente porque juntos determinan el precio y la cantidad de equilibrio del mercado particular dado $(Z, e_P, e_Q)$ .
En notación vectorial, escribimos $F = (F_P, F_Q)'$ y $e = (e_P, e_Q)'$ por lo que podemos escribir el SEM como $$ \left(\begin{matrix} P \\ Q \end{matrix}\right) = F(P, Q, Z, e). $$
Esta ecuación es aproximadamente la misma que la ecuación $$F(Y, D, X)=0$$ que se utiliza en estas diapositivas.
Para ver esto, dejemos $Y=P$ , $Q=D$ y $X=(Z, e)$ . Aunque estrictamente hablando, la ecuación $F(Y, D, X)=0$ sigue siendo más general que $F(Y, D, X)= (Y, D)'$ .
Volviendo al ejemplo del precio-cantidad, supongamos que el $F_P$ y $F_Q$ son lineales, es decir, $P = \alpha_1 Q + \beta_1' Z + e_P $ y $Q = \alpha_2 P + \beta_2' Z + e_Q$ .
Escribiendo en notación matricial, tenemos $$ \left(\begin{matrix} P \\ Q \end{matrix}\right) = \left(\begin{matrix} 0 & \alpha_1 \\ \alpha_2 & 0 \end{matrix}\right) \left(\begin{matrix} P \\ Q \end{matrix}\right) + \left(\begin{matrix} \beta_1' \\ \beta_2' \end{matrix}\right) Z + \left(\begin{matrix} e_P \\ e_Q \end{matrix}\right). $$ Redefinir esta ecuación en la forma $$ \left(\begin{matrix} P \\ Q \end{matrix}\right) = A \left(\begin{matrix} P \\ Q \end{matrix}\right) + B Z + e. $$
Supongamos que $I - A$ es no singular, entonces encontramos la solución del SEM como $$ \left(\begin{matrix} P \\ Q \end{matrix}\right) = (I - A) ^ {-1} B Z + (I - A) ^ {-1} e. $$
Esta última ecuación es lo que se llama una ecuación de "forma reducida" en la literatura del SEM.
La idea clave aquí es que la "forma reducida" es la solución algebraica de la "forma estructural" en el contexto de la SEM.
Aplicando esta idea al caso general de $F(Y, D, X)=0$ requiere que exista una función implícita $G$ (tal vez garantizado por teoremas de funciones implícitas a nivel local, etc.) tal que $$ \left(\begin{matrix} Y \\ D \end{matrix}\right) = G(X) = G(Z, e). $$
Así que $F$ aquí puede considerarse como la ecuación "estructural", y $G$ la ecuación de "forma reducida".
Si avanzamos hasta los últimos 30 años, los investigadores quieren añadir una interpretación causal a estos modelos que antes eran puramente estadísticos.
Y, para complicar aún más las cosas, hay diferentes maneras de hacerlo.
En un modelo causal de Rubin, escribimos $Y = Y(1) D + Y(0) (1 - D) $ para una variable de tratamiento binaria $D \in \{ 0, 1 \}$ . Aquí $Y(0)$ y $Y(1)$ son resultados contrafactuales revelados por el tratamiento y no observados. El efecto medio del tratamiento se define mediante estos resultados contrafactuales como en $$ ATE = E(Y(1)) - E(Y(0)). $$
En el lenguaje de Pearl (Pearl 2000, 2009), que refleja la opinión de muchos estadísticos de que "no hay causalidad sin manipulación" (véase Holland 1986), podemos definir los efectos medios del tratamiento mediante $$ ATE = E(Y|do(D=1)) - E(Y|do(D=0)).$$ Aquí la notación "do" enfatiza que el experimentador puede asignar libremente los tratamientos a los individuos.
¿Cómo mezclamos estos marcos causales en la forma estructural y/o en la forma reducida antes mencionadas?
Tal vez se pueda encontrar una variable $Z_1$ en $Z$ que aparece en la ecuación estructural para $Y$ pero no en la ecuación estructural de $D$ (se dice que es una triangular sistema). En este caso, se puede elegir el valor de $Z_1$ para crear variación en el tratamiento $D$ y luego observar los efectos $D$ tiene en el resultado $Y$ .
O podemos abandonar la ATE y centrarnos en el LATE como en Imbens y Angrist (1994).