Supongamos que tenemos una cartera que contiene un gran número (~500) de factores de riesgo. Queremos simular la dinámica de la cartera. La simulación basada en PCA sería más rápida ya que podemos reducir la dimensionalidad. ¿Existen otras ventajas del enfoque basado en PCA de Monte Carlo sobre Monte Carlo utilizando la descomposición de Cholesky (por ejemplo, estabilidad, dinámicas más realistas)? He visto documentos que tratan el efecto de estacionalidad en las curvas forward de materias primas, aplicaciones a curvas de rendimiento y un artículo aquí. Sin embargo, estoy buscando más información detallada sobre el tema. Cualquier referencia o experiencia práctica es bienvenida.
Respuestas
¿Demasiados anuncios?Además de los errores de estabilidad numérica, Cholesky y PCA (sin reducción de dimensionalidad) deberían producir exactamente la misma distribución, ya que son dos descomposiciones simétricas de la misma matriz de covarianza y, por lo tanto, son equivalentes para transformar un vector normal estándar. Por supuesto, cuando se hacen cosas diferentes con los componentes de PCA, como en la reducción de dimensionalidad o en el muestreo de quasi Monte Carlo o en métodos relacionados de reducción de varianza, la equivalencia se pierde por definición, pero está presente para el muestreo estándar. Una ventaja de Cholesky podría ser que almacenar y multiplicar una matriz triangular requiere menos recursos que una cuadrada completa. El pivoteo se utiliza para Cholesky si la matriz de covarianza no es PD (ver este documento de Higham).
Una fuente de confusión en los enlaces podría ser la falta de una clara separación entre la estimación y el muestreo. Después de la estimación, deberás tener una matriz PSD y la descomposición utilizada para el muestreo no tiene nada que ver con ella. (Los métodos de estimación también pueden ser mejores que una covarianza muestral ingenua, hay una gran cantidad de literatura al respecto).
Ten en cuenta que en el segundo enlace publicado, el procedimiento para "limpiar" las matrices no PSD para obtener una matriz de correlación olvida un paso después de igualar a cero los valores propios negativos: también debes escalar las filas y columnas para recuperar unos en la diagonal. Y también existen mejores métodos para hacer esa limpieza, esto no está devolviendo la matriz de correlación PSD más cercana. Además, esa página está mal escrita y es confusa en mi humilde opinión, si no está llena de errores, busca algo más, por ejemplo, el libro de Monte Carlo de Glasserman.
Cuando se estima matrices de covarianza, te enfrentas a problemas cuando el número de activos/factores de riesgo se acerca o excede el número de observaciones. Algunos autovalores se volverán cercanos a cero, o muy pequeños. Esto significará que la matriz de covarianza es semi-definida positiva en lugar de definitiva positiva. Dado que la descomposición de Cholesky requiere una matriz definitiva positiva, esto conlleva problemas. Sin embargo, puedes ajustar los autovalores en un enfoque de PCA para cambiar la matriz de covarianza y hacerla definitiva positiva. Podrías simular a partir de la PCA (por falta de una mejor manera de expresarlo) o usar Cholesky en la matriz de covarianza ajustada.