1 votos

Variable ficticia regresora Fórmula del coeficiente OLS

Consideremos el modelo de regresión lineal estándar: $y_i = \alpha + \beta D_i + e_i$ donde los coeficientes están definidos por proyecciones lineales y $D_i$ es una variable ficticia. En la población, los coeficientes vienen dados por:

$$\alpha = E[y_i \mid D_i =0] \ \text{and} \ \beta = E[y_i \mid D_i = 1] - E[y_i \mid D_i =0]$$

Utilizando OLS para estimar los coeficientes, obtenemos:

$$\widehat{\alpha} = \overline{y}_{D_i=0} $$

$$\widehat{\beta} = \overline{y}_{D_i=1}-\overline{y}_{D_i=0} $$

En otras palabras, $\widehat{\alpha}$ es sólo la media muestral de $y_i$ en la submuestra con $D_i=0$ y $\widehat{\beta}$ es la diferencia de las medias muestrales de los dos grupos. Las expresiones parecen muy obvias porque son sólo versiones muestrales de la población, pero mi pregunta es, ¿cómo podemos llegar a las estimaciones de los coeficientes anteriores utilizando las fórmulas OLS estándar? Es decir, utilizando:

$$\widehat{\alpha} = \overline{y} - \overline{D}\widehat{\beta} \ \ \text{and} \ \ \widehat{\beta} = \frac{\sum_{i=1}^{N}(D_i - \overline{D})(y_i - \overline{y})}{\sum_{i=1}^{N}(D_i - \overline{D})^2}$$

2voto

kruczkowski Puntos 181

Para empezar, vamos a derivar $\hat{\beta}$ . Como usted señala:

$$\hat{\beta} = \frac{\sum(D_i - \bar{D})(y_i - \bar{y})}{\sum (D_i - \bar{D})^2} $$

La clave para evaluar esto es reconocer que $D_i$ es una variable binaria que es igual a $0$ o $1$ . Así, podemos utilizar los resultados estándar sobre las variables aleatorias de Bernoulli.

Para evaluar el numerador, observe que si $D$ tiene una distribución Bernoulli:

$$ \mathrm{Cov}[D, y] = \mathbb{E}[Dy] - \mathbb{E}[D]\mathbb{E}[y] = \mathrm{P(D=1)}\mathbb{E}[y|D=1] - \mathrm{P(D=1)}\mathbb{E}[y] $$

Por la muestra análoga de esto:

$$ \frac{\sum(D_i - \bar{D})(y_i - \bar{y})}{n} = \bar{D}(\bar{y}_{D_i=1}-\bar{y})$$

Para evaluar el denominador, observe que si $D$ es una variable aleatoria de Bernouilli:

$$\mathrm{Var[D]} = \mathrm{P(D=1)}[1-\mathrm{P(D=1)]}$$

Muestra analógica:

$$\frac{\sum (D_i - \bar{D})^2}{n} = \bar{D}(1 - \bar{D})$$

Por lo tanto, vemos que:

$$\hat{\beta}=\frac{\bar{D}(\bar{y}_{D_i=1}-\bar{y})}{\bar{D}(1 - \bar{D})} = \frac{\bar{y}_{D_i=1}-\bar{y}}{1 - \bar{D}} \\ = \frac{\bar{y}_{D_i=1}-(\bar{y}_{D_i=1}\bar{D}+\bar{y}_{D_i=0}(1-\bar{D}))}{1 - \bar{D}} \\ = \bar{y}_{D_i=1} - \bar{y}_{D_i=0}$$

que es lo que queríamos mostrar.

Entonces es trivial derivar:

$$\hat{\alpha} = \bar{y} - \bar{D}\hat{\beta} =\bar{y}_{D_i=1}\bar{D}+\bar{y}_{D_i=0}(1-\bar{D}) - \bar{D}(\bar{y}_{D_i=1} - \bar{y}_{D_i=0}) = \bar{y}_{D_i=0}$$

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X