Una comparación más ajustada sería entre (i) el procedimiento Fama-Macbeth y (2) la agrupación de errores estándar por fecha. Añadir efectos fijos es algo diferente.
Problema: la correlación transversal hace que los errores estándar calculados ingenuamente estén infravalorados
Dejemos que $r_{it}$ denotan la rentabilidad de la empresa $i$ en el mes $t$ . Una cuestión estadística importante es que los rendimientos de las empresas están correlacionados en todas las secciones: $\operatorname{Cov}(r_{it}, r_{jt})$ está lejos de cero. Esto se traduce en una correlación transversal significativa y positiva en los términos de error para la mayoría de las especificaciones de regresión. El resultado final es que subestimará los errores estándar (exagerará la importancia) a menos que utilice errores estándar que sean consistentes en presencia de la correlación transversal.
¿Qué hacer?
Hay dos enfoques posibles:
- El procedimiento Fama-Macbeth: realizar una regresión transversal en cada periodo y tomar una media temporal de esas estimaciones.
- Ejecución de una regresión de panel único y agrupación de errores estándar por fecha.
Ambos métodos se basan en la correlación cero entre los términos de error de los períodos no contemporáneos. Una diferencia es la ponderación. El procedimiento Fama-Macbeth pondera cada período de tiempo por igual. Una regresión de panel dará efectivamente mayor peso a los períodos con más observaciones o mayor variación en las variables del lado derecho.
Si tus resultados son básicamente los mismos con cualquiera de los dos métodos, es genial. Si difieren, hay que tener cuidado con la pregunta de investigación concreta.
En la bibliografía de los estudios de sucesos existe un viejo debate sobre la conveniencia de ponderar por igual los sucesos o los periodos de tiempo del calendario. Por ejemplo, las ofertas públicas iniciales (OPI) tienden a agruparse en el tiempo. Ponderar cada OPI por igual o formar carteras y ponderar cada mes por igual es bastante diferente. Por ejemplo, Fama (1998) aboga por carteras de rendimientos anormales en tiempo de calendario. Los críticos (por ejemplo, Ritter) dicen que esto es ineficiente.
Configurar
Imagine que tiene el modelo de datos de panel:
$$ y_{it} = \mathbf{x}_{it} \cdot \mathbf{b} + \epsilon_{it}$$
Supongamos:
- Los términos de error están correlacionados transversalmente: $\operatorname{E}[\epsilon_{it} \epsilon_{jt}] \neq 0$ para $i \neq j$ .
- Los términos de error no están correlacionados en el tiempo: $\operatorname{E}[\epsilon_{it} \epsilon_{j\tau}] = 0$ para cualquier $i$ y $j$ y $t \neq \tau$ .
Revisión del procedimiento Fama-Macbeth
Para cada período de tiempo $t$ ejecute una regresión transversal:
$$ y_{it} = \mathbf{x}_{it} \cdot \mathbf{b}_t + \epsilon_{it}$$
A partir de esto, se obtiene una serie temporal de estimaciones $\hat{\mathbf{b}}_t$ . Bajo el supuesto de que los términos de error no están correlacionados a lo largo del tiempo, podemos entonces calcular la estimación global y los errores estándar utilizando el método más básico, Stats 1. Para cualquier componente del vector $\mathbf{b}$ se calcularía la estimación y el error estándar como
$$ \hat{b} = \frac{1}{T} \sum_t b_t \quad \quad \mathit{SE} = \sqrt{\frac{\frac{1}{T} \sum_t \left( b_t - \hat{b} \right)^2 }{T}}$$
Regresión OLS y, a continuación, agrupación de los errores estándar por tiempo
Un enfoque más moderno consiste en realizar una regresión de panel estándar y, a continuación, agrupar la variable de fecha.
Una ventaja de la configuración general del panel es que es razonablemente sencillo aplicar otros tipos de correcciones a los errores estándar si se desea (por ejemplo, Hansen-Hodrick, Newey-West, agrupación de dos vías, etc.)
Un caso especial instructivo
Si tiene un panel equilibrado y ninguna variación de la serie temporal en sus variables del lado derecho (es decir $\mathbf{x}_{it} = \mathbf{x}_i$ para todos $i$ y $t$ ), entonces su estimación de $\mathbf{b}$ utilizando una única recesión de mínimos cuadrados ordinarios y utilizando el procedimiento Fama-Macbeth son EXACTAMENTE lo mismo. Sin embargo, los dos enfoques para estimar los errores estándar pueden ser bastante diferentes dependiendo de la correlación transversal en los errores.
Si existe una variación de la serie temporal en las variables del lado derecho, las dos estimaciones serán diferentes. ¿Qué ocurre? Fama-Macbeth pondera por igual cada período de tiempo, mientras que una única regresión OLS dará efectivamente mayor peso a los períodos en los que $\mathbf{x}_{it}$ tienen una mayor variación.
Ejemplo simple que muestra cómo el procedimiento Fama-Macbeth difiere en la ponderación:
Imagina que tenemos los datos: $$ \begin{array}{cccc} y & x & i & t \\ 0 & 0 & 1 & 1 \\ 0 & 1 & 2 & 1 \\ 0 & 0 & 1 & 2 \\ 2 & 2 & 2 & 2 \end{array} $$
Aplicando el procedimiento Fama-Macbeth obtenemos $b_1 = 0$ para el período de tiempo 1 y $b_2 = 1$ por lo que nuestra estimación de $b$ es $\frac{0 + 1}{2} = .5$ .
Una regresión de panel único estimaría $b$ como aproximadamente 0,9.
Referencias:
Fama, Eugene F., 1998, "Market Efficiency, Long-Term Returns, and Behavioral Finance"
0 votos
Si lo he entendido bien, tienes algún procedimiento para desarrollar estimaciones anuales de alfa $\alpha_{it}$ y entonces estás retrocediendo $\alpha_{it}$ en varias covariables a nivel de fondos? ¿Es esto correcto? ¿Cómo son las $\alpha_{it}$ ¿calculado? ¿O se trata de un $\alpha_i$ (es decir, que no varíe con el tiempo)?
0 votos
Calculo el alfa siguiendo a Carhart (1997), donde hago una regresión de los rendimientos excesivos con respecto a los cuatro factores utilizando los últimos tres años y haciendo avanzar la regresión mensualmente. Para cada mes obtengo diferentes estimaciones (b1, b2, b3 y b4) que utilizo para calcular los rendimientos esperados. A continuación, calculo el alfa mensual como la rentabilidad real menos la rentabilidad esperada.
0 votos
Al decir "ligeramente diferente", ¿la diferencia es sustancial? ¿O no lo es realmente?
0 votos
@MatthewGunn Sí, el coeficiente de una variable (tamaño de la familia de fondos) es positivo según el Fama MacBeth. Sin embargo, es negativo cuando uso un panel de efectos fijos. Ambos son significativos al nivel del 1%. Sin embargo, mi conjunto de datos está desequilibrado debido a que tengo fondos que se incorporaron después del año 2000 y fondos que murieron antes de 2017. ¿Será que el hecho de tener un panel desequilibrado es la razón por la que estoy obteniendo resultados inconsistentes? Gracias.
0 votos
¿Cómo se mide el tamaño de la familia de fondos? Por ejemplo, ¿se mide en unidades de miles de millones o se hace algo como el tamaño logarítmico?
0 votos
@MatthewGunn Lo mido como el logaritmo natural de los activos bajo gestión de todos los fondos de la familia a la que pertenece el fondo.
0 votos
Si se añaden efectos fijos de fondos, se utiliza dentro del fondo variación de los rendimientos anormales para estimar la relación entre el tamaño de la familia de fondos y los rendimientos anormales. Una preocupación obvia pero importante es que la sincronización es bastante precisa. Es bien sabido que el rendimiento pasado predice los flujos futuros de los fondos y, por tanto, los rendimientos anormales anteriores y el tamaño actual de los fondos de inversión están relacionados. Por ejemplo, si el AUM es el AUM futuro, eso podría crear una relación positiva entre el AUM y los rendimientos anormales. No lo sé; es difícil para mí diagnosticar desde lejos.
0 votos
En teoría, también podría darse una situación como ésta imagen donde hay una relación general positiva entre $y$ y $x$ pero una vez que se tienen en cuenta los efectos fijos, es una relación negativa. (La imagen es de esta pregunta ).