7 votos

Predicción de $y$ cuando la variable de respuesta es $\ln(y)$

Mi modelo estimado es

$$\hat \ln(y_t)=9.873-0.472\ln(x_{t2})-0.01x_{t3}$$

Me piden que encuentre un IC predictivo con un 95% de confianza para la media de $y_0$ cuando $x_{02}=250$ y $x_{03}=8$ . Debemos asumir que $s^2 x_0(X^TX)^{-1}x_0^T=0.000243952$ , donde $x_0=(250,8)$ .

Tengo una solución de un año anterior, que va así:

Encuentro el CI de la forma $\text{CI}(E[ln(y_0)|x_0])=\left[\hat\ln(y_t)-t_{\alpha/2}s_E,\hat \ln(y_t)+t_{\alpha/2}s_E\right]$ , donde $t$ es el $\alpha/2$ cuantil superior de la distribución $t(n-k)$ y $s_E=\sqrt{0.000243952}$ . Esto me da $[7.1563,7.2175]$ .

Entonces el autor hace $\text{CI}(E[y_0|x_0])=[e^{7.1563},e^{7.2175}]=[1282.158,1363.077]$ .

No estoy de acuerdo con este último paso (por la desigualdad de Jensen subestimaremos). En la página 212 de la Introducción a la Econometría de Wooldridge, afirma que si estamos seguros de que los términos de error son normales, entonces un estimador consistente lo es:

$$\hat E[y_0|x_0]=e^{s^2/2}e^{\hat \ln(y_0)}$$

Así que, estaba pensando en hacer

$$\text{CI}(E[y_0|x_0])=\left[e^{s^2/2} 1282.158,e^{s^2/2}1363.077 \right] = \left[ 1282.314,1363.243 \right] $$

¿Es esto correcto?

Además, la solución de este ejercicio establece que $\text{CI}(E[y_0|x_0])=[624.020,663.519]$ que está muy lejos de cualquier solución que tenga.

Se agradecería cualquier ayuda.

P.D: También he leído que la corrección no debe usarse para el CI sino sólo para la estimación puntual $\hat E[y_0|x_0]$

3voto

dlanod Puntos 2597

No encuentra la misma respuesta por lo que sospecho que es un error tipográfico, que sería así la razón principal de su problema: $x_{03}$ se pondría en $80$ no $8$ . Otra posibilidad, si se mantiene $x_{03}=8$ es un error en el segundo coeficiente estimado, por ejemplo, $\hat{\beta}_2 = -0.1$ en lugar de $-0.01$ .

De todos modos, una de estas modificaciones lo resuelve todo y da el mismo resultado que la solución de este ejercicio.

Teniendo en cuenta este cambio, con $t_{\alpha/2}=1.96476138969835$ se obtiene

Método 1

$\text{CI}(E[y_0|x_0])=[e^{6.43618291164626},e^{6.49755798189177}]=[624.020307335178,663.519326788772]$ (la solución dada a este ejercicio)

o

Método 2

(como se indica en Wooldridge's Intro to Econometrics, en la página 212) si estamos seguros de que los términos de error son normales (y uno tiene mucha suerte)

$$\text{CI}(E[y_0|x_0])=\left[e^{s^2/2}624.0203,e^{s^2/2}663.5193 \right] = \left[ 624.0960,663.6002 \right] $$

Sin embargo,

el método 2 es muy poco probable que sea correcto, ya que como menciona en su pregunta [...] la corrección (de subestimación) no debe utilizarse para el IC sino sólo para la estimación puntual.

¿Por qué? Yo diría que por la dependencia entre ambos términos, conociendo las expectativas de $e^{s^2/2}$ por un lado y $\hat{y_0}$ por otro lado no significa que uno conozca el de $e^{\frac{s^2}{2} + \hat{\ln(y_0)}}$ .

2voto

user10775 Puntos 121

La predicción puntual y la IC son diferentes.

Para la predicción puntual, es mejor corregir el sesgo en la medida de lo posible. Para la IC, lo que se requiere desde el principio es que la probabilidad sea igual a $100(1-\alpha)\%$ . Cuando $[a,b]$ es el IC del 95% para $\ln(y_0)$ por ejemplo, $[e^a,e^b]$ es ciertamente un IC del 95% para $y_0$ porque $P(a\le \ln X\le b) = P(e^a \le X \le e^b)$ . Así que su $[e^{7.1563}, e^{7.2175}]$ es ciertamente una IC válida.

Pero el centro de este IC no es el predictor ingenuo (exp[predictor de $\ln y_0$ ]) ni el predictor corregido de $y_0$ (un factor de corrección multiplicado por el predictor ingenuo) debido a la desigualdad de Jensen, pero realmente no importa. En algunos casos (no siempre), se puede cambiar el IC a $[e^{a-p}, e^{b-q}]$ para algunos $p$ y $q$ para que la probabilidad siga siendo del 95% y su centro sea el predictor corregido por el sesgo, pero no le veo el sentido.

Lo que usted sugirió, es decir, $[e^{s^2/2}e^a,e^{s^2/2}e^b]$ no es un IC del 95%. Para ver por qué, dejemos que el factor de corrección sea $h$ (no aleatorio y perfectamente conocido, para simplificar), por lo que el predictor con corrección de sesgo es $he^{\theta}$ , donde $\theta$ es el predictor insesgado de $\ln y_0$ ( $\hat\beta_0 + \hat\beta_2 \ln x_2 + \hat\beta_3 x_3$ en su ejemplo). Este " $h$ "se puede estimar mediante $e^{s^2/2}$ por ejemplo, pero mientras este último es aleatorio, $h$ se supone que no es aleatorio para que sea sencillo. Sea $[a,b]$ sea el IC del 95% para $\ln y_0$ es decir, $P(a\le \ln y_0\le b)=0.95$ . Entonces, $$ P(he^a \le y_0 \le he^b) = P(\ln h+a \le \ln y_0 \le \ln h+b), $$ que es no igual a $P(a\le \ln y_0\le b)=0.95$ a menos que la distribución de $\ln y_0$ es uniforme, lo que no suele serlo.

EDITAR

Lo anterior se refiere a la IC de $y_0$ , no de $E(y|X=x_0)$ . La pregunta original es sobre el CI para $E(y|X=x_0)$ . Dejemos que $E(y|X=x_0) = h\exp(x_0\beta)$ que se estima mediante $\hat{h} \exp(x_0 \hat{\beta})$ . En ese caso, creo que el método Delta es una opción útil (ver la respuesta de luchonacho).

Para ser rigurosos, necesitamos la distribución conjunta de $\hat{h}$ y $\hat\beta$ o, para ser más exactos, la distribución asintótica del vector $\sqrt{n}[(\hat\beta-\beta)', \hat{h}-h]'$ . Entonces la distribución límite de $\sqrt{n}[\hat{h} \exp(x_0\hat{\beta}) - h\exp(x_0\beta)]$ se deriva utilizando el método Delta y luego los IC para $h\exp(x_0\beta)$ se puede construir.

1voto

luchonacho Puntos 7713

Utilice el Método Delta . Digamos que la distribución asintótica de grandes muestras de un solo parámetro $\beta$ es:

$$ \hat{\beta} \xrightarrow{a} N\left(\beta,\frac{Var(\hat{\beta})}{n}\right) $$

(suponiendo que su estimación sea coherente)

Además, le interesa una función de $\hat{\beta}$ digamos, $F(\hat{\beta})$ . Entonces, un primer orden de Taylor aproximación de lo anterior conduce a la siguiente distribución asintótica:

$$ F(\hat{\beta}) \xrightarrow{a} N\left(F(\beta),\left(\frac{\partial F(\hat{\beta})}{\partial \hat{\beta}}\right)^2\frac{Var(\hat{\beta})}{n}\right) $$

En su caso, $F(\hat{\beta})$ es $e^\hat{\beta}$ . A partir de aquí, puede construir el IC de forma normal.

Fuente y más detalles en el documento enlazado.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X