Mis datos tienen rendimientos de acciones durante n períodos para x acciones y m exposiciones a factores para cada acción (por ejemplo: valor, impulso) durante n períodos (resultado de las regresiones). ¿Puedo agrupar estos datos y luego calcular la matriz de correlación (matriz de x por x) y luego ejecutar la PCA? ¿Tengo que estandarizar cada conjunto de datos por separado (rendimientos y exposición a los factores)?
Respuestas
¿Demasiados anuncios?Es cuestión de elegir el modelo
- ¿cree que la volatilidad de cada una de sus acciones / factores es estacionaria?
- ¿cuál es, según usted, el número necesario de observaciones para calcular el coef de su matriz de covarianza con precisión?
Por ejemplo, los resultados sobre volatilidad brusca sugieren que si quieres usar tu estimación de volatilidad en los próximos $N$ días, debe utilizar el último $N$ días para estimarlo. Probablemente sea un número de días inferior a los que quiere estimar su covarianza...
Por otra parte, para la covarianza: ¿realmente quiere utilizar los días que abarcan desde 6 meses antes de la crisis financiera (digamos a principios de 2008) hasta un año después (digamos 2010)? Este período (relativamente corto) está hecho de un régimen de covarianza muy diferente...
Escoge tu modelo, puede ser una escala diferente para cada acción / factor, por lo tanto reduces los retornos a su "innovación", y después de eso calculas la covarianza de lo que tienes. Si quieres detalles más formalizados, te sugiero que eches un vistazo a Practical Volatility and Correlation Modeling for Financial Market Risk Management, por Torben G. Andersen, Tim Bollerslev, Peter F. Christoffersen y Francis X. Diebold .
Cuando se ejecuta PCA en la matriz de correlación, no es necesario estandarizar los datos. La correlación es lo mismo que la covarianza de los datos estandarizados. También puede experimentar con otros tipos de análisis de factores ya que el modelo $$ R = F\beta + \varepsilon, $$ donde los riesgos idiosincrásicos $\varepsilon$ no se explican por ningún factor, tiene más sentido. Por ejemplo, puede probar análisis factorial de máxima verosimilitud o factorización del eje principal . Stata y SPSS son bastante convenientes para este propósito. R también lo tiene, por supuesto.