Supongamos que tenemos la regresión larga
y=α+βD+γX+εy=α+βD+γX+ε
sino que se utiliza la regresión corta
y=α+βD+εy=α+βD+ε
entonces se puede demostrar que el estimador OLS es inconsistente y el sesgo depende de la covarianza entre XX y YY y la covarianza entre XX y DD
ˆβOLSp→β+γδ^βOLSp→β+γδ
donde δδ es el coeficiente de una regresión de XX en DD . Esto se trata en muchas clases de econometría.
¿Qué ocurre cuando la regresión larga incluye también un efecto de interacción (que presumiblemente capta la selección sobre las ganancias)?
y=α+βD+γX+ηD×X+εy=α+βD+γX+ηD×X+ε
¿y omitimos ambos términos en la regresión corta?