14 votos

¿Qué pasa si las "variables de control" también son endógenas?

Trabajo en Economía Política, y muchos de los modelos incluyen variables de control "inocentes" como la población, la desigualdad, el legado colonial, etc. para que el autor pueda afirmar imparcialidad sobre su variable independiente de interés.

Pero si alguna de estas variables de control es endógena a alguna variable omitida, ¿no contaminaría la imparcialidad de TODAS las variables independientes?

Si eso es cierto, entonces ¿qué podemos hacer? ¿Dejar esas variables de control fuera y que lleven a un sesgo por variable omitida en sí mismas? Incluirlas contaminará todo en el modelo.

Ejemplo: Un investigador quiere saber si la desigualdad lleva a la violencia, y controla algunas cosas: \begin{equation} Violencia = Desigualdad + Crecimiento + Desarrollo + \epsilon \end{equation} Viendo que Desigualdad es probablemente endógena (debido a la variable omitida Nivel de altruismo), intentará encontrar una variable instrumental para Desigualdad. ¿Pero no es probable que Crecimiento y Desarrollo también sean endógenos (es decir, correlacionados con el Nivel de altruismo)?

Este ejemplo puede parecer tonto, pero mi punto es que en Economía Política / Trabajo de Desarrollo, hay tantos factores en juego (aún omitidos) que temo que muchas variables incluidas en el LHS sean endógenas. Sin embargo, a menudo, el investigador solo busca un instrumento para su variable independiente favorita.

0 votos

Otro aspecto a considerar es el llamado problema de "mal control", una situación en la que el control es en sí mismo una variable de resultado. Te sugiero que leas la Sección 3.2.3 en el aclamado libro "Mostly Harmless Econometrics" de Angrist y Pischke para comprender este tema y por qué es importante si deseas tener una mejor comprensión de tu pregunta.

10voto

saint_groceon Puntos 2696

"Pero si alguna de estas variables de control es endógena a alguna variable omitida, ¿no contaminaría esto la imparcialidad de TODAS las variables independientes?"

No quiero enfatizar esto demasiado, pero vale la pena mencionar que esto no es cierto en general. La siguiente derivación con suerte proporcionará cierta comprensión del "contaminación" que mencionas. Como contraejemplo simple, supongamos que el proceso generador de datos está dado por $$ Y = X_1 \beta_1 + X_2 \beta_2 + Z \gamma + \varepsilon, $$ donde $Z$ no es observado. Que $Cov(X_1,Z) = 0$, $Cov(X_2, Z) \neq 0$, y $Cov(X_1,X_2) = 0$. Entonces, es claro que $X_2$ es "endógeno." Pero notar que debido a que $Cov(X_1,Z) = 0$, nuestra estimación de $\beta_1$ seguirá estando bien: $$ \text{plim}\, \hat \beta_{1} = \beta_1 + \gamma \frac{Cov(X_1^*, Z)}{Var(X_1^*)} = \beta_1, $$ donde $X_1^* = M_2 X_1$ y $M_2 = [I - X_2(X_2'X_2)^{-1}X_2']$. Debido a que $Cov(X_1,X_2) = 0$, $X_1^* = X_1$. Así que $Cov(X_1^*,Z)=0$.

"¿Qué podemos hacer?"

Uno de los principales desafíos de hacer buena econometría es pensar en estrategias potenciales de identificación. En el tipo de situación que describes, probablemente no haya mucho que puedas hacer más que intentar abordar el problema de una manera diferente.

0 votos

Mientras técnicamente tienes razón, yo no enfatizaría este punto. Prefiero decir que en general, no podemos descartar el sesgo de cualquiera de las variables, en lugar de decir en algunos escenarios está bien, bueno, porque generalmente no conocemos el DGP.

0 votos

1) ¿Podrías indicarme una referencia donde se derive $\hat\beta$ de esta manera? No me enseñaron esto en mi econometría. 2) ¿Dónde usas $Cov(X_1, Z)=0$ en la demostración? Parece que $Cov(X_1, X-2)=0$ es suficiente. 3) Estoy de acuerdo con @FooBar en que $Cov(X_1, X_2)=0$ son la excepción, no la norma. De hecho, si $Cov(X_1, X_2)=0$ no nos molestaríamos en controlar $X_2 en primer lugar (excepto para aumentar la precisión).

0 votos

@FooBar, Estoy de acuerdo. He actualizado la publicación para enfatizar que este es un caso especial. En cuanto al punto de no conocer el DGP, eso es cierto. Pero ese no es el punto. Cualquier análisis tiene que hacer suposiciones sobre el DGP y la calidad del análisis depende de la calidad de las suposiciones. La derivación que di solo sirve para ilustrar un ejemplo de las suposiciones (aunque muy fuertes suposiciones) que podrían llevarte a donde quieres ir.

6voto

Senseful Puntos 116

Todo es demasiado fuerte, pero probablemente algo. Este problema se llama "smearing". Echa un vistazo a la prueba en las notas de la conferencia de Greene en la diapositiva 5.

Emily Oster tiene un buen documento de trabajo (y el comando de Stata psacalc) que puede ayudar a limitar el sesgo.

5voto

Bernard Puntos 10700

En el contexto de la estimación de mínimos cuadrados, la forma en que tenemos que (intentar) lidiar con la posible endogeneidad de los regresores es a través de la estimación de Variables Instrumentales. Este enfoque no depende de tener solo un regresor endógeno, puedes tener muchos. En ese caso, por supuesto, necesitas encontrar más instrumentos que complican las cosas, pero en principio, el método funcionará de la misma manera.

La estimación de VI no resuelve el problema del sesgo, solo proporciona consistencia para el estimador. Pero nada resuelve el problema del sesgo, salvo la exogeneidad estricta en sí misma (y luego existen algunos métodos de reducción del sesgo). Pero si echas un vistazo a otro sitio de SE, Cross Validated, que trata sobre estadísticas, verás que los estadísticos experimentados no le dan mucho peso a la propiedad de la falta de sesgo, se centran en la Eficiencia de la Media Cuadrada para las propiedades de la muestra finita y en la consistencia para las propiedades de la muestra grande.

1 votos

Entonces, ¿el enfoque correcto es, de hecho, encontrar instrumentos para todas las variables endógenas, verdad?

1 votos

Sí, este es el camino.

5voto

Vitalik Puntos 184

Este es un ejemplo de lo que el estadístico Andrew Gelman llama "la falacia de controlar un resultado intermedio". Aquí está su descripción de esta falacia que surge cuando los investigadores preguntan si tener más hijas cambia tu postura política. La decisión de tener un segundo hijo es necesariamente condicional a la decisión previa de tener el primer hijo, y así parece ser un claro ejemplo de controlar una variable de decisión que era endógena.

Se han realizado varios estudios en los últimos años que analizan las decisiones económicas de padres de hijos, en comparación con padres de hijas....Una característica común en todos estos estudios es que controlan el número total de hijos....A primera vista, controlar el número total de hijos parece razonable. Sin embargo, hay una dificultad, ya que el número total de hijos es un resultado intermedio, y controlarlo (ya sea mediante la subdivisión de los datos basados en # niños o utilizando # niños como variable de control en un modelo de regresión) puede sesgar la estimación del efecto causal de tener un hijo (o hija).

Para ver esto, supongamos (hipotéticamente) que los padres políticamente conservadores tienen más probabilidades de querer hijos, y si tienen dos hijas, (hipotéticamente) es más probable que intenten tener un tercer hijo. En comparación, los liberales tienen más probabilidades de detenerse en dos hijas. En este caso, si observas datos de familias con 2 hijas, los conservadores estarán subrepresentados, y los datos podrían mostrar una correlación de las hijas con el liberalismo político, ¡incluso si tener las hijas no tiene ningún efecto!...

Una solución es aplicar el enfoque conservador estándar (en el sentido estadístico) para la inferencia causal, que es regresar en tu variable de tratamiento (sexo del niño) pero controlando solo por las cosas que suceden antes de que el niño nazca. Por ejemplo, se podría comparar a padres cuyo primer hijo es una niña con padres cuyo primer hijo es un niño. También se puede ver el segundo nacimiento, comparando a padres cuyo segundo hijo es una niña con aquellos cuyo segundo hijo es un niño, controlando por el sexo del primer hijo. Y así sucesivamente para el tercer hijo, etc.

¿Tener hijos te vuelve más conservador? Quizás sí, quizás no. Un problema al controlar un resultado intermedio

En cuanto a tu comentario de que "Deja fuera esas variables de control y conducen a un sesgo por variables omitidas", parece depender del tipo de instrumento que obtengas. Un buen instrumento, uno que realmente cumple con los requisitos, debe ser independiente del término de error en la segunda etapa y ser independiente de todo lo demás que estás controlando directamente. Es decir, el instrumento cambia Y solo a través de X. Por lo tanto, un instrumento adecuado para la desigualdad tiene que ser independiente del crecimiento y desarrollo (¡buena suerte encontrando eso!) si creemos que la ecuación de violencia es la ecuación estructural de la violencia.

1voto

Ozbekov Puntos 87

Como han señalado otros posts, los regresores endógenos pueden contaminar todas las estimaciones de parámetros en la regresión cuando los regresores están correlacionados.

Además, puede parecer difícil concebir una situación donde, por ejemplo, $X_1$ y $X_2$ estén correlacionados y $X_2$ sea endógeno pero $X_1$ no lo sea.

Sin embargo, se requiere menos que eso para garantizar la consistencia de $\hat{\beta}_1$ incluso cuando $X_2$ es endógeno y $X_1$ y $X_2$ están correlacionados.

Considera el siguiente modelo (analógico a la notación de @jmbejara)

\begin{equation*} y=X_1\beta_1+X_2\beta_2+Z\gamma+\varepsilon, \end{equation*}

$Z$ no observado, con las suposiciones habituales de exogeneidad con respecto a $\varepsilon$, es decir, $\frac{1}{n}{x_1^{(k)\prime}}\varepsilon\overset{p}{\rightarrow}0$ y $\frac{1}{n}x_2^{(k)\prime}\varepsilon\overset{p}{\rightarrow}0$ para todos los $k$ regresores. $X_2$ es endógeno en el sentido de que $\frac{1}{n} x_{1}^{(k)\prime}z^{(l)} \overset{p}{\not\rightarrow}0$ para algún par de variables $(k,l)$.

Ahora, si $X_2$ es endógeno pero $X_1$ no lo es en el sentido de que toda correlación entre $X_1$ y $Z$ desaparecerá después de controlar por $X_2$, es decir,

\begin{equation} \frac{1}{n} x_1^{(k)\prime}Q_{X_2}z^{(l)} \overset{p}{\rightarrow}0 \end{equation} para todos $(k,l)$, donde $Q_{X_2}$ es la proyección sobre el espacio nulo de $X_2$ (el "creador residual"), es decir, $Q_{X_2}\equiv [I_n - X_2(X_2'X_2)^{-1}X_2']$ entonces estamos bien. La razón se ve en el siguiente estimador en dos pasos de $\beta_1$ (por ejemplo, Amemiya, 1985, pp. 6-7):

\begin{align*} \hat{\beta}_1 &= (X_1'Q_{X_2}X_1)^{-1}X_1'Q_{X_2}y \\ &= \beta_1 + (X_1'Q_{X_2}X_1)^{-1}X_1'\underbrace{Q_{X_2}X_2}_{\overset{p}{\rightarrow}0}\beta_2\\ &+ (X_1'Q_{X_2}X_1)^{-1}\underbrace{X_1'Q_{X_2}Z}_{\overset{p}{\rightarrow}0}\gamma \\ &+ (X_1'Q_{X_2}X_1)^{-1}\underbrace{X_1'Q_{X_2}\varepsilon}_{\overset{p}{\rightarrow}0} \end{align*} QED. La tercera línea aquí es clave, y también muestra por qué estamos seguros cuando $X_1$ y $X_2$ no están correlacionados/ortogonales. Felices regresiones endógenas.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X