Me gustaría saber si la lógica de estas dos situaciones es correcta.
Situación 1: Digamos que tenemos una variable dependiente continua, $y_1$ que luego tiene un impacto causal en una variable no observada, $\rho$ . Esta variable no observada tiene entonces un impacto causal sobre una variable, $y_2$ que tiene un impacto causal en $y_1$ . Queremos estimar $ \frac{\partial y_1}{\partial y_2}$ . Así, tenemos un conjunto de ecuaciones estructurales como las siguientes:
$$y_1 = f(y_2, \mathbf{x_1})+ e_1$$ $$\rho = f(y_1, \mathbf{x_2})+ e_2$$ $$y_2 = f(\rho, \mathbf{x_3})+ e_3$$
donde el $\mathbf{x_i}$ son exógenos y los $e_i$ términos son errores. Sustituyendo la segunda ecuación en la tercera, podemos ver que tendríamos simultaneidad y nuestras estimaciones del impacto de $y_2$ en $y_1$ estaría sesgada si no pudiéramos controlar $\rho$ o alguna aproximación a ella en nuestra estimación de la ecuación estructural para $y_1$ .
Estoy especialmente inseguro sobre esta última parte en cursiva. ¿Podríamos utilizar el proxy para $\rho$ en la estimación de la ecuación estructural para $y_1$ o tendríamos que hacer 2SLS, con la proxy para $\rho$ ¿se incluye en la primera etapa pero se excluye en la segunda?
Situación 2: Digamos que tenemos una variable dependiente porcentual, $s_1$ . Digamos que el complemento de $s_1$ se compone de otros dos porcentajes, $s_2$ y $s_3$ . Además, digamos que $s_3$ tiene un impacto causal en un factor no observado, $\rho$ y que $\rho$ tiene un impacto causal en $y_2$ que tiene un impacto causal en $s_1$ . Queremos estimar $\frac{\partial s_1}{\partial y_2}$ . Así, tenemos las siguientes ecuaciones estructurales:
$$s_1 = f(y_2, \mathbf{x_1})+ e_1$$ $$\rho = f(s_3, \mathbf{x_2})+ e_2$$ $$y_2 = f(\rho, \mathbf{x_3})+ e_3$$
Digamos ahora que $s_2$ es más o menos constante en todas las observaciones. Por lo tanto, generalmente existe una relación inversa entre $s_1$ y $s_3$ . Esto implica que podemos reescribir $s_3$ en las segundas ecuaciones estructurales en términos de $s_1$ :
$$\rho = f(1 - (s_1 + \bar{s}_2), \mathbf{x_2})+ e_2$$
Entonces, al igual que en la situación 1, al sustituir esta ecuación en la ecuación estructural de $y_2$ podemos ver que habría simultaneidad y nuestras estimaciones del impacto de $y_2$ en $y_1$ estaría sesgada (una vez más, no estoy seguro de si controlar por $\rho$ o una aproximación a ella en nuestra estimación de la ecuación estructural para $y_1$ lo solucionaría).