3 votos

Del marco conceptual a la estimación econométrica

Cuando ejecuto la siguiente regresión, encuentro que $\beta>0$

$$ y_i=\beta D_i+\varepsilon_i$$

Para explicar el hallazgo, escribí un marco conceptual y obtuve la siguiente predicción

$$\frac{\partial y_i}{\partial D_i}=L_i \frac{1}{1+e(1-\alpha)}$$

Por suposición $\alpha \in (0,1)$ , $e>0$ y $L_i>0$ . Por lo tanto, $\frac{\partial y_i}{\partial D_i}>0$ se confirma generalmente. Pero lo que me preocupa es que el $L_i$ término que varía según $i$ . POR CIERTO, $\frac{\partial L_i}{\partial D_i}$ es una función de $D_i$ . ¿Cómo puedo contabilizar el $L_i$ en mi marco econométrico?

6voto

user10287 Puntos 61

Utilizar la regresión no paramétrica. Una versión particular que me viene a la mente es regresión lineal local . Esto se puede escribir como

$$Y_i = \beta_{0i} + \beta_{1i}X_i + \epsilon_i,$$

permitiendo así la heterogeneidad individual en $\partial Y_i/\partial D_i = \beta_{1i}$ . El modelo se ajusta mediante una regresión ponderada tal que

$$\hat \beta_i = (X^\top W_iX)^{-1}(X^\top W_iY),$$

donde $W_i$ es un $N \times N$ matriz diagonal con el $n$ siendo el elemento diagonal $K((x_i-x_n)/h)$ donde $K$ es el núcleo elegido y $h$ es el ancho de banda (véase, por ejemplo, Le y Racine 'Non-Parametric Econometrics' página 81).

0 votos

Esto se parece a los mínimos cuadrados ponderados. Se trata de un método de estimación, mientras que la regresión ponderada probablemente no sea la forma correcta de expresarlo.

0 votos

Dado que la matriz de pesos es diagonal, a cada observación se le asigna un único peso, como en la regresión ponderada. Numéricamente se obtiene $(\hat \beta_{i1})$ para $i=1,...,N$ realizando una única estimación de mínimos cuadrados ponderados. Pero hay que hacer este procedimiento $N$ veces para conseguir todo $\hat \beta_{i1}$ . Y por lo tanto es diferente de WLS en ese sentido.

0 votos

En cuanto a la elección de la redacción, véase es.wikipedia.org/wiki/Mínimos cuadrados ponderados donde se dice "mínimos cuadrados ponderados (WLS), también conocidos como regresión lineal ponderada". Así que la redacción no es mía.

2voto

tdm Puntos 146

Tldr:

  • Si $D_i$ es una variable ficticia, entonces si $cov(L_i, D_i)> 0$ entonces OLS sobreestimará el efecto medio de $D_i$ en $y_i$ . Si $cov(L_i, D_i)< 0$ la estimación OLS subestimará este efecto medio.
  • Si $D_i$ no es una variable ficticia, entonces el efecto también depende de la covarianza entre $L_i$ y $(D_i)^2$ .

Supongamos que el modelo verdadero viene dado por: $$ y_i = \gamma + \dfrac{1}{1 + e(1-\alpha)}L_i D_i + \eta_i, $$ donde $\eta_i$ no está relacionado con $D_i$ y tiene una media de cero.

Para una variable $X_i$ escribir $\bar X = \mathbb{E}(X_i)$ entonces podemos reescribir la ecuación anterior como $$ y_i = \gamma + \dfrac{\bar L}{1 + e(1-\alpha)}D_i + \sigma_i, $$ donde $$ \sigma_i = \eta_i + \dfrac{(L_i - \bar L)}{1 + e(1-\alpha)} D_i. $$ Observe que $\sigma_i$ tiene media: $$ \begin{align*} \mathbb{E}(\sigma_i) &= \dfrac{\mathbb{E}(L_i D_i) - \bar L \bar D}{1 + e(1-\alpha)}\\ &= \dfrac{cov(L_i,D_i)}{1 + e(1-\alpha)}. \end{align*} $$ Que no es necesariamente cero, pero esto no es un gran problema ya que será capturado por el término constante en la regresión.

Supongamos que ejecutamos la siguiente especificación: $$ y_i = \delta + \beta D_i + \varepsilon_i, $$ Entonces la estimación de $\beta$ se estimará asintóticamente: $$ \dfrac{cov(y_i, D_i)}{var(D_i)}. $$ Calculemos el numerador: $$ \begin{align*} y_i - \bar y &= \dfrac{\bar L}{1 + e(1-\alpha)}(D_i - \bar D) + \sigma_i - \mathbb{E}(\sigma_i)\\ &= \dfrac{\bar L}{1 + e(1-\alpha)}(D_i - \bar D) + \eta_i + \dfrac{(L_i - L) D_i}{1 + e(1-\alpha)}- \dfrac{cov(L_i,D_i)}{1 + e(1-\alpha)}. \end{align*} $$ Entonces: $$ \begin{align*} (y_i - \bar y)(D_i - \bar D) = \dfrac{\bar L}{1 + e(1-\alpha)}(D_i - \bar D)^2 + \eta_i(D_i - D) + \dfrac{(L_i - \bar L)D_i(D_i - \bar D)}{1 + e(1-\alpha)} - \dfrac{cov(L_i, D_i)}{1 + e(1-\alpha)}(D_i - \bar D) \end{align*} $$ Así que tomando la expectativa de ambas partes da: $$ cov(y_i, D_i) = \dfrac{\bar L}{1 + e(1-\alpha)}var(D_i) + \dfrac{\mathbb{E}((L_i - \bar L)(D_i - \bar D)D_i)}{1 + e(1-\alpha)} $$ El último término da: $$ \begin{align*} &\dfrac{1}{1 + e(1-\alpha)}\left[\mathbb{E}(L_i D_i D_i) - \mathbb{E}(\bar L D_i D_i) - \mathbb{E}(L_i \bar D D_i) + \mathbb{E}(\bar L \bar D D_i) \right],\\ &=\dfrac{1}{1 + e(1-\alpha)}\left[\mathbb{E}(L_i D_i D_i) - \bar L \mathbb{E}(D_i D_i) - \bar D \mathbb{E}(L_i D_i) + \bar L (\bar D)^2 \right],\\ &=\dfrac{1}{1 + e(1-\alpha)}\left[\mathbb{E}(L_i (D_i)^2) - \bar L \overline{D^2} - \bar D\left[\mathbb{E}(L_i D_i) - \bar L \bar D\right] \right],\\ &= \dfrac{1}{1 + e(1-\alpha)} \left[ cov(L_i, (D_i)^2) - \bar D cov(L_i, D_i)\right] \end{align*} $$ Así que la estimación OLS convergerá a: $$ \dfrac{\bar L}{1 + e(1-\alpha)} + \dfrac{1}{1 + e(1-\alpha)} \dfrac{cov(L_i, (D_i)^2)}{var(D_i)} - \bar D \dfrac{1}{1 + e(1-\alpha)} \dfrac{cov(L_i, D_i)}{var(D_i)}. $$ Si $D_i$ es una variable ficticia, entonces $(D_i)^2 = D_i$ así que $cov(L_i,(D_i)^2) = cov(L_i, D_i)$ y $var(D_i) = \bar D(1-\bar D)$ así que, tenemos: $$ \begin{align*} &\dfrac{\bar L}{1 + e(1-\alpha)} + \dfrac{1}{1 + e(1-\alpha)}(1 - \bar D)\dfrac{cov(L_i, D_i)}{\bar D(1-\bar D)},\\ &= \dfrac{\bar L}{1 + e(1-\alpha)} + \dfrac{1}{1 + e(1-\alpha)}\dfrac{cov(L_i, D_i)}{\bar D}, \end{align*} $$ Si $cov(L_i, D_i) > 0$ entonces la estimación OLS tenderá a sobreestimar $\dfrac{\bar L}{1 + e(1-\alpha)}$ si $cov(L_i, D_i) < 0$ entonces el OLS subestimará este efecto medio de $D$ en $y$ .

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X