3 votos

Diferencia de interpretación de los coeficientes log-lin con variable binaria

Considera el modelo:

$$y_i=\beta_0+\beta_1D_1+\beta_2D_2+u_i$$

Dónde $D_1=\{0,1\}$ y $D_2=\{0,1\}$ son variables binarias (ficticias), y $y_i$ es una variable continua en niveles.

En este modelo, por ejemplo $\beta_1$ se interpreta como la diferencia entre la categoría cuando $D_1=1$ y $D_1=0$ . Además, esta brecha está en absoluto términos, digamos en términos de las unidades del $y_i$ variable.

Ahora, considere el modelo similar pero la variable dependiente está en logaritmos:

$$\ln (y_i)=\beta_0+\beta_1D_1+\beta_2D_2+u_i$$

Yo pensaría que, por ejemplo, $\beta_1$ es la diferencia entre las categorías mencionadas pero en relativa términos, digamos una proporción o un porcentaje. Digamos que en la categoría media $D_1=1$ recibe $\beta_1*100$ por ciento más (o menos) de $y_1$ que $D_1=0$ en promedio.

Pero he encontrado otra aproximación en mi clase para esta brecha, y toma la brecha a partir del hecho de que la brecha relativa:

$$Rel. gap\; between\; [D_1=1]\; and\; [D_1=0]=\frac{y_1-y_0}{y_0}*100\% = \left(\frac{y_1}{y_0}-1\right)*100\%$$

Dónde $y_1=y(D_1=1)$ y $y_0=y(D_1=0)$

Teniendo en cuenta esto podemos obtener:

$$\ln (y_1)-\ln(y_0)=\beta_1 \implies \frac{y_1}{y_0}=e^{\beta_1}$$

Sustituyendo esto en la ecuación de la brecha relativa especificada anteriormente, obtenemos:

$$Rel. gap\; between\; [D_1=1]\; and\; [D_1=0]=\left ( e^{\beta_1} -1 \right)*100\%$$

Mi pregunta es: ¿Cuál es concretamente la diferencia entre esas dos aproximaciones? E incluso si una de ellas tal vez sea errónea, porque las brechas resultantes que se pueden obtener son muy diferentes. Por otra parte, ¿cuál debe uno utilizar con fines académicos.

Gracias.

0 votos

Esto sería más fácil de explicar y entender si no restara $1$ . Si $e^{\beta_1}=2.5$ entonces teniendo $D_1=1$ multiplica la estimación de $y$ por $2.5$ , mientras que si $e^{\beta_2}=4$ entonces teniendo $D_2=1$ multiplica la estimación de $y$ por $4$ y al tener ambos se multiplica la estimación de $y$ por $10$ . Así que mucho más simple que decir que estos aumentan las estimaciones de $y$ por $150\%$ , $300\%$ y $900\%$ respectivamente

4voto

Arjun Puntos 24

Como se puede ver en la trama, no son lo mismo. De hecho, la "regla empírica", es decir, tu primera fórmula, sólo es válida en la aproximación. El error aumenta cuando los valores de los coeficientes son grandes.

plot

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X