1 votos

Variable omitida Sesgo y declaraciones descriptivas

Digamos que $y=c+ax+by+error$ (donde el término de error cumple todos los supuestos) describe la realidad. Si tenemos $z=vx$ que $y=h+max+s$ también describirá la realidad. Al leer sobre OVB he visto afirmaciones como "si el verdadero modelo es $y=c+ax+by+error$ y x y z están correlacionadas, entonces la regresión sólo sobre x sobreestimará (o subestimará) el verdadero coeficiente de ." ¿Pero esto parece tratar de establecer causalidad? Si sólo estamos hablando de modelos descriptivos, podría haber muchos coeficientes correctos diferentes para dependiendo de las variables incluidas en el modelo, ¿no?

0voto

Matthias Benkard Puntos 11264

No se trata de causalidad. La causalidad es una afirmación de que $x$ causa $y$ pero no es el valor del coeficiente ( $a$ en su modelo). Incluso si sólo le importan las estimaciones de los coeficientes, obtendrá una respuesta incorrecta. Esto se debe a que la fórmula para la estimación del coeficiente $a$ es decir $\hat{a}$ en MCO simple puede expresarse como:

$$\hat{a} = a + \beta \frac{\text{COV}(x,z) }{VAR(x)} $$

Esa es la estimación de $a$ que se obtiene de OLS es la verdadera estimación $a$ + el verdadero valor de $\beta$ que sería el coeficiente de $z$ si realmente lo incluirías en un modelo estimando $y=c+ax+\beta z + error$ multiplicado por la covarianza de $x$ y $z$ y dividido por la varianza de $x$ . Ahora la varianza de $x$ debe ser distinto de cero sólo para poder estimar OLS en primer lugar y la varianza es siempre positiva por lo que la sobreestimación o subestimación vendrá dada por el signo de la covarianza y la $\beta$ .

Ahora bien, tanto si le importa la causalidad como si no, este sesgo sigue siendo importante, considere el siguiente ejemplo. Quieres estimar el efecto de la educación de los padres en el número de hijos que tienen. No te importa la causalidad, sólo quieres calcular cuál es el coeficiente dentro de tu muestra, es decir, sólo te importa cuál es el número medio de hijos para una pareja con años medios de educación, y además supongamos que la educación también está correlacionada con los ingresos. Además, para facilitar los cálculos, supongamos que VAR $(x)=0.5$ y COV $(x,z)=0.5$ y que la media de años de educación de los padres es de 10 años. Supongamos que el modelo real es el siguiente (ya he sustituido $c,a,\beta$ con cifras reales):

$$y_i= 10 -0.3x_i-0.2z_i + u_i$$

En este modelo real, una familia con una educación media de 10 tendría de media 3 hijos menos en comparación con una familia sin educación. Tenga en cuenta que no estoy diciendo nada acerca de la causalidad esto es sólo puramente preocuparse por describir descriptivamente el hogar con educación media.

Sin embargo, observe lo que ocurre si ahora omitimos $z$ del modelo de regresión y calcular $a$ utilizando la fórmula anterior:

$$y_i= 5 - 0.42x_i+ u_i$$

ahora la estimación sugiere que la familia con una educación media tiene 4 hijos menos, lo que es totalmente erróneo: esta estimación subestima el número de hijos de la familia media en 1,5 millones de euros. $25\%$ . En este caso, el signo sigue siendo el mismo, pero eso es sólo debido a los números que elegí en la vida real sesgo podría cambiar fácilmente el signo del coeficiente por completo.

Por lo tanto, incluso si no le importa la causalidad y sólo desea utilizar la regresión para alguna descripción del conjunto de datos, le preocupa el sesgo de las variables omitidas.

PD: También en mi respuesta omití $by$ de tu ejemplo: $ y=c+ax+by+error$ ya que debe haber algún error tipográfico no se puede retroceder $y$ en sí mismo, sin embargo, su fórmula incluye $y$ en ambos lados. O para ser específicos se podría hacer eso, pero matemáticamente coeficiente siempre se establece en $1$ cuando se hace una regresión de una variable sobre sí misma, por lo que nunca hay razón para hacerlo.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X