Xtreg
xtreg
es un general para la regresión de paneles. Las regresiones de panel tendrán la siguiente forma general (véase manual de stata ):
$$y_{it} = α + \mathbf{x_{it}β} + ν_i + \epsilon_{it}$$
donde $y_{it}$ es una variable dependiente $x_{it}$ variables independientes, $\alpha$ es constante, $\beta$ parámetros, $v_i$ son efectos fijos y $\epsilon$ término de error.
Dependiendo de la opción que elija xtreg
puede ser:
- modelo de efecto fijo
xtreg dep var ind var, fe
- esta estimación utiliza el estimador inside:
$$ (y_{it} − \bar{y}_i) = (x_{it} − \bar{x}_i)β + (\epsilon_{it} − \bar{\epsilon}_i)$$
- modelo de efecto aleatorio
xtreg dep var ind var, re
o ,mle
o ,pa
- esta estimación utiliza el estimador de efectos aleatorios dado por:
$$(y_{it} − θ\bar{y}_i) = (1 − θ)α + (x_{it} − θ\bar{x}_i)β + (1 − θ)ν_i + (\epsilon_{it} − θ\bar{\epsilon}_i)$$
donde $θ$ es una función de $\sigma_ν^2$ y $\sigma_\epsilon^2$ . Se puede considerar como una versión "ponderada" del estimador FE. De hecho, si $\sigma_ν^2= 0 \implies \theta=0$ por lo que este estimador se convierte en una regresión multivariante regular, y si $\sigma_\epsilon=0 \implies \theta=1$ y esto se convierte en el estimador descrito anteriormente.
El mle
y pa
Las opciones también estiman el modelo de efectos aleatorios con el primero estimando el estimador aleatorio de máxima verosimilitud, y el segundo el modelo de media de la población. No voy a entrar en estas variantes, ya que estaría fuera del alcance de esta respuesta, pero son sólo una variación de lo anterior.
- Modelo entre efectos
xtreg dep var ind var, be
utiliza el estimador entre que utiliza:
$$ \bar{y}_i = α + \bar{x}_iβ_1 + ν_i + \bar{\epsilon}_i$$
donde las medias se calculan a lo largo del tiempo, por ejemplo $\bar{y_i} = \frac{\sum_t y_{ti}}{(n-1)}$
areg
areg
es un comando que estima una regresión lineal que absorbe un factor categórico (ver manual de stata ). Se utiliza cuando se enfrenta a un modelo como:
$$ y = Xβ + d_1γ_1 + d_2γ_2 + · · · + d_kγ_k + \epsilon$$
donde $d_1,...,d_k$ son unos tontos.
En principio, el modelo anterior puede ajustarse mediante una regresión regular y en stata con reg
pero si $k$ es demasiado grande usted excedería el tamaño de mat de stata (esto es limitación en el tamaño de las matrices, la versión estudiantil de stata tiene un tamaño de mat especialmente pequeño donde esto puede ser fácilmente un problema, stata pequeño sólo puede tener matsize de 100 y stata IC sólo 800 <- este es un problema único relacionado con stata y cómo ellos 'empujan' a la gente a comprar versiones más grandes).
areg
elude el problema del tamaño de las matas al absorber los maniquíes, no hay ninguna otra diferencia significativa entre areg
y reg
reghdfe
reghdfe
ejecuta regresiones lineales y de variables instrumentales con muchos niveles de efectos fijos, implementando el estimador de Correia (2015) según los autores de este comando escrito por el usuario ver aquí .
Según los autores reghde
es la generalización del modelo de efectos fijos y, por tanto, el xtreg ..., fe
. Aquí el comando se generaliza para permitir múltiples efectos fijos, por lo que se podría ejecutar algo como:
$$ Y = Zβ + D_1α + D_2γ + \epsilon $$
donde ambos $D_1$ y $D_2$ son efectos de panel fijos pero con diferente dimensionalidad.
Además, el comando permite la agrupación de errores en varias direcciones. La agrupación de errores es una técnica para controlar la heteroscedasticidad y la autocorrelación. xtreg
sólo permite la agrupación en una dirección, por lo que, por ejemplo, en la regresión de los resultados académicos de los alumnos sobre alguna política educativa, se podría agrupar a nivel de escuela, lo que permitiría la heteroscedasticidad de los errores dentro de la agrupación. La agrupación multidireccional le permite añadir capas adicionales a esas agrupaciones, por lo que podría agrupar adicionalmente a nivel de condado o por año, etc.
Diferencias
Evidentemente, hay varias diferencias entre todos los estimadores anteriores y es imposible resumirlas todas en un solo post de SE.
(Muy) ampliamente:
- Estimador interno: en el estimador interno se asignan todos los miembros del panel
fixed
que capta las inobservables invariables en el tiempo. Uno de los problemas de este estimador es que no puede manejar los regresores invariantes en el tiempo (a diferencia del estimador de efectos aleatorios, por ejemplo).
- estimador de efectos aleatorios - el estimador de efectos aleatorios permite
partial pooling
donde las estimaciones del efecto de un grupo se derivan parcialmente de la información de los grupos más abundantes. Esto puede tener una ventaja sobre la agrupación completa de todos los grupos (es decir, efectos fijos), ya que eso puede hide
La variación a nivel de grupo, y la estimación de un efecto para todos los miembros del panel/grupo por separado, puede dar lugar a estimaciones pobres para los grupos de baja muestra. Además, este estimador puede manejar también especificaciones de modelo más ricas (por ejemplo, incluso regresores invariantes en el tiempo, etc.), pero estas ventajas también tienen el coste de ser más fácilmente presa de algunos sesgos sutiles (véase la discusión de ese aquí ).
- El estimador de efectos intermedios es una especie de "opuesto" al estimador de efectos fijos. Mientras que el estimador de efectos fijos utiliza esencialmente la información de las series temporales del panel, el estimador de efectos cruzados utiliza la información transversal del panel. La mayoría de las veces estamos interesados en el efecto de $x$ en $y$ en un individuo concreto, que es cuando el efecto fijo es más apropiado, pero en aquellos casos en los que se está interesado principalmente en las diferencias entre dos individuos causadas por $x$ entre los efectos sería más apropiado.
areg
es sólo reg
con dummies absorbidos y puede utilizarlo cuando quiera estimar cualquier regresión con demasiadas variables dummy para que stata pueda manejarlas con sus restricciones de tamaño de mats (por ejemplo, varios modelos de secciones cruzadas agrupadas). Esto es útil principalmente si tiene la versión pequeña/IC de stata o trabaja con paneles muy grandes.
reghdfe
es una extensión de xtreg ..., fe
que permite añadir más efectos fijos y más agrupaciones, lo que es importante en situaciones en las que es apropiado.
La razón por la que se obtienen resultados similares es que, dependiendo de la forma en que se estimen estos modelos, se pueden obtener estimadores muy similares.
Por ejemplo, el estimador interno xtreg ..., fe
es esencialmente equivalente a la ejecución de un OLS agrupado con variables ficticias para cada miembro del panel y este mismo resultado se puede lograr mediante reg
o areg
dependiendo de cómo especifique sus maniquíes. Además, dependiendo de cómo configure reghdfe
de nuevo podría terminar con sólo efectos fijos dentro del estimador. Si deja que todas las variables sean sólo instrumentos para sí mismas, si no utiliza ningún efecto bidireccional de fantasía o agrupación, entonces no debería ver mucha diferencia en esos casos, pero por lo demás son estimadores distintos.
Además, una advertencia importante que hay que tener en cuenta es que sólo se trata de diferencias superficiales entre los modelos. Hay más cuando se mira "bajo el capó" de cada estimador (véanse las fuentes enlazadas). Por lo general, no hay que utilizarlos como sustitutos de los demás, sino que hay que utilizar cada uno de ellos en función de los detalles del problema concreto al que nos enfrentemos y de lo que nos interese descubrir.