Esto no haría que el instrumento fuera necesariamente inválido. Para algún modelo de instrumento 2SLS de la forma:
$$y_i = \beta_0 + \beta_1 \hat{x_i} + \beta_2 k_i +\epsilon_i$$
$$x_i = \pi_0 + \pi_1 z_i + \pi_2 k_i +e_i $$
donde $y$ es la variable dependiente, $x_i$ es el regresor endógeno, $k$ algunos controles y $z$ las principales condiciones de validez del instrumento son:
-
$z$ tiene que estar correlacionado con el $x$ variable $cov(x,z)\neq 0$ y tienen un efecto causal en $x$
-
$z$ puede afectar a la $y$ sólo a través de $x$ y $z$ tiene que ser exógena $cov(z,\epsilon)=0$
Además, el instrumento no debe ser débil, lo que invalidaría la inferencia de la regresión, por lo que la primera etapa debe tener $F$ -estadística más alta entonces $10$ como regla general (aunque algunos resultados nuevos sugieren que en realidad la regla general correcta sería tener $F>105$ - ver Lee, McCrary, Moreira y Porter 2020 ).
Puede encontrar pruebas más rigurosas de estas condiciones en hanbooks de econometría como Verbeek (2008) guide to modern econometrics o Angrist & Pischke (2009) Mostly Harmless Econometrics. La cuestión es que ninguna de las condiciones dice directamente que el instrumento no pueda estar correlacionado con otros controles mientras no viole ninguna otra de las condiciones. De hecho, omitirlos podría conducir a un sesgo de variable omitida, violando la condición de que el instrumento debe ser endógeno si es importante. Sin embargo, tener variables altamente correlacionadas puede inflar los errores estándar de su modelo debido a la multicolinealidad; dicho esto, la multicolinealidad no conduce al sesgo, sólo reduce la precisión de las estimaciones y reduce la potencia estadística.