5 votos

¿Cuáles son las principales diferencias entre xtreg, areg y reghdfe?

Normalmente, cuando corro regresiones para datos de panel en Stata usando estos tres comandos (xtreg,areg, reghdfe), los resultados respecto a los coeficientes de las variables son bastante similares; las únicas diferencias están en el R-cuadrado y intercept. Me pregunto cuáles son las principales diferencias en estos tres códigos?

Además de eso, el resultado al correr por areg o reghdfe es mucho mayor que el de xtreg, ¿hay alguna restricción en reportar los resultados usando areg o reghdfe en lugar de xtreg?

Regresión xtreg:

xtset TYPE2 yr

xtreg y x i.yr, fe

Regresión areg:

areg y x i.yr, a(TYPE2)

Regresión reghdfe:

reghdfe y x, a(TYPE2 yr)

Vi una pequeña explicación aquí sobre la diferencia en los interceptos entre areg y xtreg

8voto

Matthias Benkard Puntos 11264

Xtreg

xtreg es un general para la regresión de paneles. Las regresiones de panel tendrán la siguiente forma general (véase manual de stata ):

$$y_{it} = α + \mathbf{x_{it}β} + ν_i + \epsilon_{it}$$

donde $y_{it}$ es una variable dependiente $x_{it}$ variables independientes, $\alpha$ es constante, $\beta$ parámetros, $v_i$ son efectos fijos y $\epsilon$ término de error.

Dependiendo de la opción que elija xtreg puede ser:

  1. modelo de efecto fijo xtreg dep var ind var, fe - esta estimación utiliza el estimador inside:

$$ (y_{it} − \bar{y}_i) = (x_{it} − \bar{x}_i)β + (\epsilon_{it} − \bar{\epsilon}_i)$$

  1. modelo de efecto aleatorio xtreg dep var ind var, re o ,mle o ,pa - esta estimación utiliza el estimador de efectos aleatorios dado por:

$$(y_{it} − θ\bar{y}_i) = (1 − θ)α + (x_{it} − θ\bar{x}_i)β + (1 − θ)ν_i + (\epsilon_{it} − θ\bar{\epsilon}_i)$$

donde $θ$ es una función de $\sigma_ν^2$ y $\sigma_\epsilon^2$ . Se puede considerar como una versión "ponderada" del estimador FE. De hecho, si $\sigma_ν^2= 0 \implies \theta=0$ por lo que este estimador se convierte en una regresión multivariante regular, y si $\sigma_\epsilon=0 \implies \theta=1$ y esto se convierte en el estimador descrito anteriormente.

El mle y pa Las opciones también estiman el modelo de efectos aleatorios con el primero estimando el estimador aleatorio de máxima verosimilitud, y el segundo el modelo de media de la población. No voy a entrar en estas variantes, ya que estaría fuera del alcance de esta respuesta, pero son sólo una variación de lo anterior.

  1. Modelo entre efectos xtreg dep var ind var, be utiliza el estimador entre que utiliza:

$$ \bar{y}_i = α + \bar{x}_iβ_1 + ν_i + \bar{\epsilon}_i$$

donde las medias se calculan a lo largo del tiempo, por ejemplo $\bar{y_i} = \frac{\sum_t y_{ti}}{(n-1)}$

areg

areg es un comando que estima una regresión lineal que absorbe un factor categórico (ver manual de stata ). Se utiliza cuando se enfrenta a un modelo como:

$$ y = Xβ + d_1γ_1 + d_2γ_2 + · · · + d_kγ_k + \epsilon$$

donde $d_1,...,d_k$ son unos tontos.

En principio, el modelo anterior puede ajustarse mediante una regresión regular y en stata con reg pero si $k$ es demasiado grande usted excedería el tamaño de mat de stata (esto es limitación en el tamaño de las matrices, la versión estudiantil de stata tiene un tamaño de mat especialmente pequeño donde esto puede ser fácilmente un problema, stata pequeño sólo puede tener matsize de 100 y stata IC sólo 800 <- este es un problema único relacionado con stata y cómo ellos 'empujan' a la gente a comprar versiones más grandes).

areg elude el problema del tamaño de las matas al absorber los maniquíes, no hay ninguna otra diferencia significativa entre areg y reg

reghdfe

reghdfe ejecuta regresiones lineales y de variables instrumentales con muchos niveles de efectos fijos, implementando el estimador de Correia (2015) según los autores de este comando escrito por el usuario ver aquí .

Según los autores reghde es la generalización del modelo de efectos fijos y, por tanto, el xtreg ..., fe . Aquí el comando se generaliza para permitir múltiples efectos fijos, por lo que se podría ejecutar algo como:

$$ Y = Zβ + D_1α + D_2γ + \epsilon $$

donde ambos $D_1$ y $D_2$ son efectos de panel fijos pero con diferente dimensionalidad.

Además, el comando permite la agrupación de errores en varias direcciones. La agrupación de errores es una técnica para controlar la heteroscedasticidad y la autocorrelación. xtreg sólo permite la agrupación en una dirección, por lo que, por ejemplo, en la regresión de los resultados académicos de los alumnos sobre alguna política educativa, se podría agrupar a nivel de escuela, lo que permitiría la heteroscedasticidad de los errores dentro de la agrupación. La agrupación multidireccional le permite añadir capas adicionales a esas agrupaciones, por lo que podría agrupar adicionalmente a nivel de condado o por año, etc.

Diferencias

Evidentemente, hay varias diferencias entre todos los estimadores anteriores y es imposible resumirlas todas en un solo post de SE.

(Muy) ampliamente:

  • Estimador interno: en el estimador interno se asignan todos los miembros del panel fixed que capta las inobservables invariables en el tiempo. Uno de los problemas de este estimador es que no puede manejar los regresores invariantes en el tiempo (a diferencia del estimador de efectos aleatorios, por ejemplo).
  • estimador de efectos aleatorios - el estimador de efectos aleatorios permite partial pooling donde las estimaciones del efecto de un grupo se derivan parcialmente de la información de los grupos más abundantes. Esto puede tener una ventaja sobre la agrupación completa de todos los grupos (es decir, efectos fijos), ya que eso puede hide La variación a nivel de grupo, y la estimación de un efecto para todos los miembros del panel/grupo por separado, puede dar lugar a estimaciones pobres para los grupos de baja muestra. Además, este estimador puede manejar también especificaciones de modelo más ricas (por ejemplo, incluso regresores invariantes en el tiempo, etc.), pero estas ventajas también tienen el coste de ser más fácilmente presa de algunos sesgos sutiles (véase la discusión de ese aquí ).
  • El estimador de efectos intermedios es una especie de "opuesto" al estimador de efectos fijos. Mientras que el estimador de efectos fijos utiliza esencialmente la información de las series temporales del panel, el estimador de efectos cruzados utiliza la información transversal del panel. La mayoría de las veces estamos interesados en el efecto de $x$ en $y$ en un individuo concreto, que es cuando el efecto fijo es más apropiado, pero en aquellos casos en los que se está interesado principalmente en las diferencias entre dos individuos causadas por $x$ entre los efectos sería más apropiado.
  • areg es sólo reg con dummies absorbidos y puede utilizarlo cuando quiera estimar cualquier regresión con demasiadas variables dummy para que stata pueda manejarlas con sus restricciones de tamaño de mats (por ejemplo, varios modelos de secciones cruzadas agrupadas). Esto es útil principalmente si tiene la versión pequeña/IC de stata o trabaja con paneles muy grandes.
  • reghdfe es una extensión de xtreg ..., fe que permite añadir más efectos fijos y más agrupaciones, lo que es importante en situaciones en las que es apropiado.

La razón por la que se obtienen resultados similares es que, dependiendo de la forma en que se estimen estos modelos, se pueden obtener estimadores muy similares.

Por ejemplo, el estimador interno xtreg ..., fe es esencialmente equivalente a la ejecución de un OLS agrupado con variables ficticias para cada miembro del panel y este mismo resultado se puede lograr mediante reg o areg dependiendo de cómo especifique sus maniquíes. Además, dependiendo de cómo configure reghdfe de nuevo podría terminar con sólo efectos fijos dentro del estimador. Si deja que todas las variables sean sólo instrumentos para sí mismas, si no utiliza ningún efecto bidireccional de fantasía o agrupación, entonces no debería ver mucha diferencia en esos casos, pero por lo demás son estimadores distintos.

Además, una advertencia importante que hay que tener en cuenta es que sólo se trata de diferencias superficiales entre los modelos. Hay más cuando se mira "bajo el capó" de cada estimador (véanse las fuentes enlazadas). Por lo general, no hay que utilizarlos como sustitutos de los demás, sino que hay que utilizar cada uno de ellos en función de los detalles del problema concreto al que nos enfrentemos y de lo que nos interese descubrir.

0 votos

Gracias 1muflon1, estoy un poco confundido aquí ? "Dentro del estimador - en el estimador dentro se asignan efectos fijos a todos los miembros del panel, lo cual captura las inobservables invariantes en el tiempo. Un problema con este estimador es que no puede manejar regresores constantes en el tiempo (en contraposición, por ejemplo, al estimador de efectos aleatorios)".

1 votos

@Knowledge-chaser, ¿qué te confundió exactamente de eso? Si tienes algún $x_i$, es imposible estimar beta ya que el estimador interno está basado en $(x - \bar{x})\beta$ y con $x_i$ sin ninguna dimensión $t$, el corchete siempre es $0$, lo que significa que es equivalente a tener $0 \cdot \beta$, lo cual es equivalente a nunca incluir ese beta en la regresión en primer lugar.

0 votos

Lo tengo ahora, gracias 1muflon1

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X