Considera el modelo:
$$y_i=\beta_0+\beta_1D_1+\beta_2D_2+u_i$$
Dónde $D_1=\{0,1\}$ y $D_2=\{0,1\}$ son variables binarias (ficticias), y $y_i$ es una variable continua en niveles.
En este modelo, por ejemplo $\beta_1$ se interpreta como la diferencia entre la categoría cuando $D_1=1$ y $D_1=0$ . Además, esta brecha está en absoluto términos, digamos en términos de las unidades del $y_i$ variable.
Ahora, considere el modelo similar pero la variable dependiente está en logaritmos:
$$\ln (y_i)=\beta_0+\beta_1D_1+\beta_2D_2+u_i$$
Yo pensaría que, por ejemplo, $\beta_1$ es la diferencia entre las categorías mencionadas pero en relativa términos, digamos una proporción o un porcentaje. Digamos que en la categoría media $D_1=1$ recibe $\beta_1*100$ por ciento más (o menos) de $y_1$ que $D_1=0$ en promedio.
Pero he encontrado otra aproximación en mi clase para esta brecha, y toma la brecha a partir del hecho de que la brecha relativa:
$$Rel. gap\; between\; [D_1=1]\; and\; [D_1=0]=\frac{y_1-y_0}{y_0}*100\% = \left(\frac{y_1}{y_0}-1\right)*100\%$$
Dónde $y_1=y(D_1=1)$ y $y_0=y(D_1=0)$
Teniendo en cuenta esto podemos obtener:
$$\ln (y_1)-\ln(y_0)=\beta_1 \implies \frac{y_1}{y_0}=e^{\beta_1}$$
Sustituyendo esto en la ecuación de la brecha relativa especificada anteriormente, obtenemos:
$$Rel. gap\; between\; [D_1=1]\; and\; [D_1=0]=\left ( e^{\beta_1} -1 \right)*100\%$$
Mi pregunta es: ¿Cuál es concretamente la diferencia entre esas dos aproximaciones? E incluso si una de ellas tal vez sea errónea, porque las brechas resultantes que se pueden obtener son muy diferentes. Por otra parte, ¿cuál debe uno utilizar con fines académicos.
Gracias.
0 votos
Esto sería más fácil de explicar y entender si no restara $1$ . Si $e^{\beta_1}=2.5$ entonces teniendo $D_1=1$ multiplica la estimación de $y$ por $2.5$ , mientras que si $e^{\beta_2}=4$ entonces teniendo $D_2=1$ multiplica la estimación de $y$ por $4$ y al tener ambos se multiplica la estimación de $y$ por $10$ . Así que mucho más simple que decir que estos aumentan las estimaciones de $y$ por $150\%$ , $300\%$ y $900\%$ respectivamente