La respuesta sencilla es no .
La aleatoriedad no implica exogeneidad.
En mi opinión, el siguiente ejemplo de Deaton: "La aleatorización en los trópicos, y la búsqueda de las escurridizas claves del desarrollo económico" es bastante esclarecedor.
Supongamos que se quiere estimar el efecto de tener una estación de ferrocarril sobre la pobreza. Tenemos datos sobre la tasa de pobreza $P_c$ y la presencia de una estación $R_c \in \{0,1\}$ para un gran número de ciudades $c$ . Supongamos que el verdadero proceso de generación de datos viene dado por: $$ P_c = \alpha + \beta_c R_c + \varepsilon_c, $$ Obsérvese que la pendiente $\beta_c$ es específico de cada ciudad, por lo que el efecto de un ferrocarril es heterogéneo entre ciudades.
El coeficiente $\beta_c$ no se puede estimar, pero cabe preguntarse si es posible estimar la media de $\beta_c$ sobre todas las ciudades que decidan construir un ferrocarril. $\overline{\beta} = \mathbb{E}(\beta_c|R_c = 1)$ . Entonces: $$ P_c = \alpha + \overline{\beta} R_c + (\varepsilon_c + (\beta_c - \overline{\beta})R_c) = \alpha + \overline{\beta} R_c + \upsilon_c, $$ donde $\upsilon_c = \varepsilon_c + (\beta_c - \overline{\beta})R_c$ es el nuevo error. Aunque $\mathbb{E}(\upsilon_c) = 0$ puede que te preocupe que..: $$ \mathbb{E}(R_c \upsilon_c) \ne 0. $$ En efecto, lo hemos hecho: $$ \mathbb{E}(R_c \upsilon_c) = \mathbb{E}(\varepsilon_c R_c = 1) + \mathbb{E}(\beta_c - \overline{\beta}|R_c = 1) \Pr(R_c = 1) = \mathbb{E}(\varepsilon_c R_c). $$ Sólo será cero si la decisión de construir una estación no está relacionada con nada que pueda influir en la tasa de pobreza de la ciudad. Como es probable que esto no se cumpla, necesitamos un instrumento.
Un instrumento aleatorio
Supongamos que el gobierno asigna aleatoriamente las ciudades a las zonas de desarrollo, captadas por el instrumento $Z_c$ (igual a 1 si la ciudad $c$ es una zona de desarrollo y cero en caso contrario).
Si las designaciones a las zonas de desarrollo motivan la construcción de ferrocarriles, tenemos que existe una correlación positiva entre $Z_c$ y $R_c$ . También como $Z_c$ es aleatorio, podemos suponer que $\mathbb{E}(Z_c \varepsilon_c) = 0$ . Sin embargo: $$ \mathbb{E}(Z_c \upsilon_c) = \mathbb{E}(\varepsilon_c Z_c) + \mathbb{E}(\beta_c - \overline{\beta}|Z_c = 1, R_c = 1)\Pr(R_c = 1, Z_c = 1). $$ El primer término del lado derecho es cero por la aleatoriedad de $Z_c$ . Como tal, $Z_c$ no tendrá correlación con $\upsilon_c$ si: $$ \mathbb{E}(\beta_c - \overline{\beta}|Z_c = 1, R_c = 1) = \mathbb{E}(\beta_c|Z_c = 1, R_c = 1) - \mathbb{E}(\beta_c|R_c = 1) = 0. $$ Este será el caso si el efecto medio de la construcción de una estación sobre todas las ciudades que son un área de desarrollo es igual al efecto medio sobre todas las ciudades que construyen el ferrocarril (sean o no un área de desarrollo).
La última condición puede reescribirse como $$ \begin{align*} &\mathbb{E}(\beta_c|Z_c = 1, R_c = 1) = \mathbb{E}(\beta_c|R_c = 1),\\ \to &\mathbb{E}(\beta_c|Z_c = 1, R_c = 1) = \mathbb{E}(\beta_c|Z_C = 1, R_c = 1) \Pr(Z_c = 1) + \mathbb{E}(\beta_c|Z_c = 0, R_c = 1) \Pr(Z_c = 0),\\ \to &\mathbb{E}(\beta_c|Z_c = 1, R_c = 1)\Pr(Z_c = 0) = \mathbb{E}(\beta_c|Z_c = 0, R_c = 1) \Pr(Z_c = 0),\\ \to &\mathbb{E}(\beta_c|Z_c = 1, R_c = 1)\Pr(Z_c = 0|R_c = 1) = \mathbb{E}(\beta_c|Z_c = 0, R_c = 1)\Pr(Z_c = 0|R_c = 1),\\ \to &\mathbb{E}(\beta_c|Z_c = 1, R_c = 1)\Pr(Z_c = 0, R_c = 1) = \mathbb{E}(\beta_c|Z_c = 0, R_c = 1) \Pr(Z_c = 0, R_c = 1). \end{align*} $$ Este será el caso si:
- $\mathbb{E}(\beta_c|Z_c = 1, R_c = 1) = \mathbb{E}(\beta_c|Z_c = 0, R_c = 1)$ lo que significa que el efecto medio entre todas las ciudades que son un área de desarrollo y deciden construir un ferrocarril debe ser igual al efecto medio entre las que construyen un ferrocarril y no son un área de desarrollo. Por lo tanto, si el comportamiento (es decir, la decisión de construir una estación) cambia debido a la designación como zona de desarrollo, esta condición no se cumplirá.
- O $Pr(Z_c = 0, R_c = 1) = 0$ lo que significa que ninguna ciudad que no sea una zona de desarrollo construye una estación.
En resumen: la aleatoriedad del instrumento asegura que $\mathbb{E}(\varepsilon_c Z_c) = 0$ pero no garantiza que $\mathbb{E}(\upsilon_c Z_c) = 0$ .