2 votos

Variable omitida Sesgo con términos de interacción

Supongamos que tenemos la regresión larga

y=α+βD+γX+εy=α+βD+γX+ε

sino que se utiliza la regresión corta

y=α+βD+εy=α+βD+ε

entonces se puede demostrar que el estimador OLS es inconsistente y el sesgo depende de la covarianza entre XX y YY y la covarianza entre XX y DD

ˆβOLSpβ+γδ^βOLSpβ+γδ

donde δδ es el coeficiente de una regresión de XX en DD . Esto se trata en muchas clases de econometría.

¿Qué ocurre cuando la regresión larga incluye también un efecto de interacción (que presumiblemente capta la selección sobre las ganancias)?

y=α+βD+γX+ηD×X+εy=α+βD+γX+ηD×X+ε

¿y omitimos ambos términos en la regresión corta?

3voto

user10775 Puntos 121

Cuando yy se hace una regresión sobre DD solamente, tenemos ˆβols=ni=1Diyini=1Dini=1(1Di)yini=1(1Di),^βols=ni=1Diyini=1Dini=1(1Di)yini=1(1Di), que se puede demostrar utilizando el álgebra. El resto es sencillo. Tenemos plimˆβols=E(y|D=1)E(y|D=0).plim^βols=E(y|D=1)E(y|D=0). Con y=α+βD+γX+η(DX)+ε,y=α+βD+γX+η(DX)+ε, donde E(ε|D,X)=0,E(ε|D,X)=0, tenemos E(y|D=1)=α+β+γE(X|D=1)+ηE(X|D=1),E(y|D=0)=α+γE(X|D=0), y por lo tanto plimˆβols=β+γ[E(X|D=1)E(X|D=0)]+ηE(X|D=1).

He hecho una simulación.

set.seed(1)
n <- 100000
d <- as.numeric(rnorm(n) > 0)
x <- 0.5*d + rnorm(n, mean=1)
# E(x|d=1)=1.5, E(x|d=0)=0.5
y <- 1-0.5*d+x+2*d*x+rnorm(n)
# beta=-0.5, gamma=1, eta=2
# plim bhat(ols) = -0.5 + 1*(1.5-0.5) + 2*(1.5) = 3

Por esto, β=0.5 , γ=1 , η=2 , E(x|d=1)=0.5+1=1.5, y E(x|d=0)=1, para que el límite de probabilidad del estimador OLS sea 0.5+1(1.51)+2(1.5)=3. Sí, es cierto,

lm(y~d)

# Call:
# lm(formula = y ~ d)
#
# Coefficients:
# (Intercept)            d  
#       1.997        3.005

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X