Estoy utilizando un python script para replicar el factor mensual UMD, sin tener en cuenta las pequeñas capitalizaciones (es decir, centrándome sólo en las subcarteras "BIG HiPRIOR" y "BIG LoPRIOR" del prof. French).
Para ello, estoy mapeando el universo de acciones al Russell 1000, que tiene un buen ajuste en términos de corte de capitalización de mercado, y descargando datos de Bloomberg para los constituyentes relevantes durante el período 1997-2015. A continuación, sigo la metodología descrita en el sitio web del prof. French (ordenar los rendimientos 12-2, tomar el 30% superior e inferior, etc.).
Mi problema es el siguiente: Consigo una réplica muy aproximada de los rendimientos del BIG HiPRIOR durante todo el periodo. Sin embargo, utilizando exactamente la misma metodología y los mismos datos, no consigo replicar el BIG LoPRIOR:
Después de varios días de intentar, sin éxito, múltiples vías para explicar la discrepancia, se me ocurrió que la diferencia en el rendimiento parecía una especie de acumulación en el tiempo. Así que decidí descargar la tasa libre de riesgo del sitio web del prof. French para ver si explicaba la diferencia. Sorprendentemente, lo hizo casi perfectamente - si añado la tasa libre de riesgo a la tasa LoPrio del prof. Si añado la tasa libre de riesgo sólo a los rendimientos LoPrior del profesor French, la coincidencia es tan buena como la de la cartera HiPrior:
Este es el problema: la tasa libre de riesgo nunca formó parte del conjunto de datos original que descargué de Bloomberg (todo lo que descargué fueron los rendimientos de las acciones individuales de los componentes del índice durante el período correspondiente). Por lo tanto, no es posible que un error en mi código haya introducido ese sesgo consistente a lo largo del tiempo en una cartera pero no en la otra. Los datos libres de riesgo simplemente no existían en lo que respecta a mi modelo.
Así que en este punto estoy completamente perdido para explicar esta cuestión. Por un lado, me resulta imposible creer que haya un problema con los rigurosos cálculos del prof. French; por otro lado, no puedo explicar cómo un sesgo tan preciso (el tipo libre de riesgo mensual en cada punto del tiempo durante un período de 18 años, afectando sólo a la cartera LoPrior) podría haberse colado en mi modelo si esos datos simplemente no existían cuando ejecuté el modelo.
¿Podría preguntar, para sacarme de dudas, si alguien ha realizado un ejercicio similar y ha replicado con éxito cada una de las subcarteras utilizadas en la construcción del factor UMD?
Muchas gracias de antemano por cualquier ayuda/claridad que alguien pueda aportar sobre este tema.
0 votos
¿Ha considerado el sesgo de supervivencia?
0 votos
Hola: al construir mi conjunto de datos he tenido en cuenta todos los valores que han pertenecido al índice, no sólo los que existen en la actualidad. Además, si fuera así, seguramente debería ver un efecto tanto en la cartera HiPrior como en la LoPrior, no sólo en esta última.
0 votos
Así que en Sitio web de French , crees que de la "6 carteras formadas en función del tamaño y el impulso (2 x 3)". ¿crees que la gran cartera de baja rentabilidad anterior puede estar perdiendo la tasa libre de riesgo? (¿O que su código está defectuoso?) ¿He entendido bien tu post?
0 votos
Sí, eso es exactamente lo que quería decir.
0 votos
En particular, para la variedad "equal weighted", que es de la que partí por ser más fácil de replicar. Dicho esto, estoy en proceso de replicar las tablas de "valor ponderado" y creo que el problema también aparece.
0 votos
Por curiosidad, intenté calcular los rendimientos de la cartera con los datos del CRSP. Sé que no estoy igualando (todavía) lo que hizo Fama-French precisamente porque el número de empresas en cada una de mis carteras no coincide con ellas. Creo que es más fácil igualar las carteras de valor porque las empresas grandes van a ser menos sensibles a los problemas de selección de muestras exactas... (buenos datos de precios en las fechas t-13, t-1, t-3 etc...) mattgunn.com/share/PRELIMINARY_big_lowpriorret.csv
0 votos
Un pensamiento al azar: los LoPrior son los que se supone que están cortos, me pregunto si eso tiene algo que ver con la forma de calcular su rendimiento? ¿De alguna manera se renuncia a la tasa libre de riesgo porque se está corto?
0 votos
Matt: muchas gracias por tus cifras preliminares. Se acercan bastante a las del prof. French, así que tengo claro que la cuestión está de mi lado. No es que esperara otra cosa.
0 votos
Alex - gracias por la sugerencia. De momento sigo tratando la baja previa como una larga, sin hacer nada raro en ella, así que no creo que sea así pero volveré a comprobarlo. Debe haber un error bastante obvio en ese sentido mirándome fijamente.
0 votos
Otra cuestión: Si el límite de la capitalización de mercado del Russell 1000 está por encima de la capitalización de mercado media de la Bolsa de Nueva York en algunos momentos, el Russell 1000 puede no tener los mayores perdedores de la gran cartera de Fama-French porque los mayores perdedores pueden abandonar el índice.
0 votos
Parece que tengo el mismo problema que tú. Los ganadores funcionan bien, los perdedores parecen estar sobreestimados. ¿Ha encontrado finalmente lo que estaba mal en su réplica?