1 votos

Regresión simple con variable ficticia

Consideremos un modelo lineal simple:

$Y = \beta_1 + \beta_2 MALE + u$

donde $MALE$ es una variable ficticia. $MALE = 0$ si es mujer, $MALE = 1$ si es hombre.

Se ajusta un modelo:

$\hat{Y} = \hat{\beta_1} + \hat{\beta_2} MALE$

$\bar{Y_F}$ y $\bar{Y_M}$ son las medias muestrales de $Y$ para las mujeres y los hombres, respectivamente.

Pruébalo:

$\hat{\beta_1} = \bar{Y_F}$ , $\hat{\beta_2} = \bar{Y_M} - \bar{Y_F}$

Si los puntos se representan en un bloque de dispersión, habrá dos grupos verticales de puntos en $MALE = 0$ y $MALE = 1$ como se muestra:

Scatter plot and regression line

Parece intuitivamente obvio que la suma total de cuadrados residuales ( $RSS$ ) se reduce al mínimo minimizando el $RSS$ por separado para los puntos hembra y macho. Esto se consigue ajustando un punto a la media de estos puntos, $\bar{Y_F}$ y $\bar{Y_M}$ . Si se ajusta una línea entre estos puntos, se obtienen los valores correctos para $\hat{\beta_1}$ y $\hat{\beta_2}$ .

Quiero demostrar esto algebraicamente.

0 votos

Este no es un lugar para hacer trabajos en casa. Si aportas tu solución (o al menos un intento) y explicas tus dudas, podrás recibir ayuda

0 votos

@Alessandro Gracias por tu comentario. Me he ido y he vuelto a intentar la pregunta. Mi respuesta es la siguiente.

0voto

S. Michaels Puntos 50

Encuentre $\hat{\beta_2}$ :

$$\hat{\beta_2}=\frac{\Sigma(Y_i-\bar{Y})(MALE - \overline{MALE})}{\Sigma(MALE - \overline{MALE})^2}$$

Suponiendo que haya m varones en una muestra de n personas, $$\overline{MALE}=\frac{m}{n}$$

Podemos decir:

$$MALE - \overline{MALE}=\begin{cases}-\frac{m}{n} & \text{if }MALE=0\\\\\frac{n-m}{n} & \text{if }MALE=1\end{cases}$$

Con algo de álgebra, el numerador de $\hat{\beta_2}$ se convierte:

$$\Sigma(Y_i-\bar{Y})(MALE - \overline{MALE})=\frac{m(n - m)}{n}(\bar{Y_M} - \bar{Y_F})$$

El numerador de $\hat{\beta_2}$ se convierte:

$$\Sigma(MALE - \overline{MALE})^2=\frac{m(n - m)^2 + m^2(n - m)}{n^2}=\frac{m(n - m)}{n}$$

Dividiendo los dos se obtiene la respuesta correcta:

$$\hat{\beta_2}=\bar{Y_M} - \bar{Y_F}$$

Encuentre $\hat{\beta_1}$ :

$$\hat{\beta_1}=\bar{Y}-\hat{\beta_2}\overline{MALE}=\frac{m\bar{Y_M}+(n - m)\bar{Y_F}}{n} - (\bar{Y_M} - \bar{Y_F})\frac{m}{n}=\bar{Y_F}$$

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X