3 votos

¿Cómo obtener las estimaciones de la varianza ajustada al sesgo para efectos fijos de alta dimensión en un modelo lineal?

Quiero hacer una regresión lineal: $y_{i}=\psi_{j(i)}+X_{i}^{\prime} \xi+\varepsilon_{i}$ , donde $\psi_{j(i)}$ es un efecto fijo de alta dimensión sobre el grupo $j$ , $X_i$ son las covariables de cada observación $i$ y $\varepsilon_{i}$ es un error que se supone exógeno.

Esta regresión lineal puede ser realizada por muchos paquetes estadísticos a través del método LSMR que evita invertir la matriz del regresor.

Sin embargo, después de esta regresión quiero calcular la varianza ponderada por tamaño de los efectos fijos $$\theta_{\psi}=\sum_{j=1}^{J} s_{j}\left(\psi_{j}-\bar{\psi}\right)^{2}$$ , donde $s_j$ es la cuota del grupo. Sin embargo, el simple "complemento" estima $$\begin{aligned} \hat{\theta}_{\psi} =\sum_{j=1}^{J} s_{j}\left(\hat{\psi}_{j}-\hat{\bar{\psi}}\right)^{2} =\sum_{j=1}^{J} s_{j}\left(\hat{\psi}_{j}\right)^{2}-(\hat{\bar{\psi}})^{2} \end{aligned}$$ tiene un sesgo ascendente porque $$\begin{aligned} \mathbb{E}\left[\hat{\theta}_{\psi}\right] &=\sum_{j=1}^{J} s_{j} \mathbb{E}\left[\left(\hat{\psi}_{j}\right)^{2}\right]-\mathbb{E}\left[(\hat{\psi})^{2}\right] \\ &=\sum_{j=1}^{J} s_{j}\left\{\psi_{j}^{2}+\mathbb{V}\left[\hat{\psi}_{j}\right]\right\}-(\bar{\psi})^{2}-\mathbb{V}[\hat{\bar{\psi}}] \\ &=\theta_{\psi}+\underbrace{\sum_{j=1}^{J} s_{j} \mathbb{V}\left[\hat{\psi}_{j}\right]-\mathbb{V}[\hat{\bar{\psi}}]}_{\text {bias }} \end{aligned}$$ .

Una corrección sencilla consiste en utilizar el error estándar convencional de la HC: $$\theta_{\psi} \approx \hat{\theta}_{\psi} - \sum_{j=1}^{J} s_{j} \hat{\mathbb{V}}_{H C}\left[\hat{\psi}_{j}\right]$$ .

Sin embargo, los efectos de alta dimensión estimados a partir del método LSMR no proporcionan errores estándar. Por lo tanto, no tengo ni idea de cómo hacer esta corrección.

Otra forma de hacer la corrección es asumir $\mathbb{V}[\varepsilon]=I \sigma^{2}$ y luego calcular directamente $$\mathbb{V}[\hat{\psi}]=\left(\tilde{F}^{\prime} \tilde{F}\right)^{-1} \sigma^{2}$$ , donde $\tilde{F}$ es la versión residualizada de $F$ y $F$ es la matriz ficticia de ${\psi}_{j(i)}$ .

Sin embargo, no tengo ni idea de cómo retroceder $F$ en $X$ para obtener el residuo $\tilde{F}$ (¿cómo puedo hacer la regresión de una matriz ficticia?) y también cómo invertir el $\left(\tilde{F}^{\prime} \tilde{F}\right)$ .

3voto

tdm Puntos 146

Supongo que esto se deduce del teorema Frish-Waugh Lovell.

Si tiene $K$ tontos y dicen $n$ observaciones, por lo que $F$ es $n \times K$ es necesario hacer una regresión de cada maniquí en $F$ en todas las variables de $X$ por separado ( $K$ regresiones). Los residuos constituyen la matriz $\bar F$ que también es de dimensión $n \times K$ .

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X