3 votos

PCA para la clasificación de riesgos

Estoy trabajando en un proyecto para justificar el uso de ciertos tenores (2y, 5y, 10y, 30y) para la clasificación de riesgos. Estoy un poco atascado después de calcular los componentes principales. Sólo para describir mi enfoque-

a) Obtenga los tipos de swap de GBP para 1y - 60y para 2 años de datos históricos (Digamos X matriz).

b) Se han calculado las diferencias diarias y, a continuación, la matriz de correlación

c) Calculado los valores propios y la matriz de vectores propios (digamos A)

d) Para recuperar las tasas de PC Y (digamos, PC01, PC02,...PC60), hice una multiplicación matricial de la matriz X degradada y los vectores propios (digamos, X_dm y A)

e) Se han trazado los gráficos PC01, PC02 y PC03 y la forma ha confirmado lo esperado para el nivel, la pendiente y la curvatura

f) Por lo que he leído en un artículo, si comparo el PC01 con el tipo de interés de los swaps a 5 o 10 años, la mayoría de las veces seguirán el mismo patrón. Sin embargo, esto es algo que no pude confirmar. (Proporcionando un enlace del artículo)

Así que mi pregunta es ¿cómo puedo demostrar que el uso de 2y, 5y, 10y y 30y está justificado para la agrupación de riesgos y no otros cubos alternativos?

Lamentablemente, como estoy trabajando en esto desde mi oficina, no puedo pegar las cifras/gráficos que he generado.

Artículos referidos - https://www.garp.org/#!/risk-intelligence/all/all/a1Z1W000003rQUYUA2

https://www.clarusft.com/principal-component-analysis-of-the-swap-curve-an-introduction/

Una pregunta más: si alguien revisa el artículo de GARP, ¿cómo se genera realmente la figura 2? ¿Alguna idea?

0 votos

¿Su pregunta es técnica o sobre la interpretación de sus resultados? Puedo ayudar con ambas, pero no puedo decir por su pregunta cuál es. En cuanto a la figura sobre la que pregunta, es probable que se genere utilizando ggcorrplot en R

0 votos

Hola Bram, supongo que se trata de ambas cosas, es decir, después del paso e, cómo procedo para mostrar que 2y, 5y, 10y, 30y se mueven independientemente pero otros tenores no. He trazado PC01, PC02, PC03 junto con los cuatro tipos, pero no he visto ningún patrón. También corrí una correlación entre estos para ver si daría algún resultado significativo, pero no probó mucho.

0 votos

3. Análisis del Valor Relativo - la riqueza/barbarie de la curva puede ser monitoreada por los residuos PCA, ¿Qué quieren decir con los residuos pca aquí? @Bram

3voto

dotnetcoder Puntos 1262

Así que mi pregunta es ¿cómo puedo demostrar que el uso de 2y, 5y, 10y y 30y está justificado para la agrupación de riesgos y no otros cubos alternativos?

Bien, sólo para plantear un segundo punto de vista, pero ¿por qué hay que utilizar necesariamente el PCA para hacer esto?

Básicamente estás tratando de demostrar que dada cualquier cartera de intercambio subyacente $P$ puede encontrar un conjunto de operaciones / exposiciones al riesgo en la cartera $Q$ tal que el PnL de $P + Q$ se minimiza sobre alguna métrica, es decir, el PnL final o la norma de los cambios diarios del pnl.

La pregunta que se hace entonces es si se limita a tener sólo canjes en $Q$ de cubos de 2Y, 5Y, 10Y, 30Y, es esto efectivo, y es esto más efectivo que alguna otra combinación de cubos.

Parece una tarea de análisis estadístico o de aprendizaje automático intensivo desde el punto de vista computacional. Generar muchas carteras aleatorias $P_i$ calcular las coberturas $Q_i$ con restricciones de cubos en $Q_i$ y ver lo que obtienes. Nota: sugiero esto ya que también podría ser capaz de factorizar la convexidad / gamma cruzada en este escenario que es probable que sea una preocupación en términos de PnL acumulado.

Alternativamente (para un análisis lineal) podrías usar tu matriz de covarianza y asumir una distribución multivariada de Guassian de las tasas y posiblemente llegar a la prueba matemática en papel. Puede que lo intente mañana y lo vuelva a publicar.

Modelización bajo la normalidad multivariable

Si hace el Suponiendo que los movimientos del mercado se distribuyen de forma multivariable-normal con media cero y con un estimador de covarianza como el anterior entonces, $\mathbf{\Delta r} \sim \mathcal{N}(\mathbf{0}, \mathbf{\Sigma})$ .

Una métrica de riesgo asociada a una cartera de exposiciones de riesgo, $P$ es la desviación estándar del VaR de varianza-covarianza: $$c = \mathbf{P^T \Sigma P} \;, \quad \text{where VaR-99pc is} \quad c_{99} = \Phi^{-1}(0.99)c$$ para $\Phi(x)$ la función de distribución acumulativa normal estándar.

Supongamos que quiere cubrir, o simular, esa cartera con otra cartera de exposiciones al riesgo, $\mathbf{Q}$ entonces el riesgo de la diferencia se puede expresar como $$c^* = \mathbf{(P^T-Q^T) \Sigma (P-Q)} $$

Obviamente, si se pueden "negociar" todas las exposiciones, el riesgo mínimo (es decir, cero) se encuentra cuando $\mathbf{P=Q}$ . Sin embargo, en su caso está restringiendo $\mathbf{Q}$ de manera que muchos de sus elementos sean cero y sólo se permitan los correspondientes a los cubos 2y, 5y, 10y y 30y, es decir $\mathbf{Q} = [0,..,0,q_{2y},0,...,0,q_{5y},0,..]$

Usted busca los valores $q_{2y}, q_{5y}, ..$ tal que $c^*$ (el riesgo residual) es mínimo . Como se trata de una forma cuadrática hay una solución única. Me ahorraré el cálculo matricial y me limitaré a decir que: $$\mathbf{\hat{Q}} = \mathbf{\hat{\hat{\Sigma}}^{-1}\hat{\Sigma}P}$$ donde $\mathbf{\hat{Q}}$ son los elementos no nulos de $\mathbf{Q}$ , $\mathbf{\hat{\Sigma}}$ son las filas de $\mathbf{\Sigma}$ correspondiente a los elementos no nulos de $\mathbf{Q}$ y $\mathbf{\hat{\hat{\Sigma}}}$ son las filas y columnas de $\mathbf{\Sigma}$ correspondiente a los elementos no nulos de $\mathbf{Q}$ .

Así que ahora basado en tu matriz de covarianza tienes las cantidades analíticas de cobertura, $q_{2y}, q_{5y},..$ que minimizará el VaR para la cartera dada $\mathbf{P}$ .

¿Cómo puede ser esto útil?

1) En primer lugar, ahora tiene un medio para evaluar la calidad de su seto. $c^*$ es el VaR residual mínimo: ¿está contento con su tamaño dada su cartera conocida? $\mathbf{P}$ ?

2) Puede elegir una combinación diferente de instrumentos de cobertura y calcular de nuevo el VaR residual. Quizás sea mejor. Obviamente, cuantos más instrumentos se incluyan, más pequeño será el VaR residual.

3) Si está interesado en la calidad de una cobertura de 2 años, 5 años, 10 años y 30 años en general, le gustaría examinar $E[c^*]$ donde la expectativa se mide con respecto al espacio de probabilidad de todas las carteras posibles. Esto es bastante difícil de medir ya que necesitas definir un espacio de probabilidad de carteras y eso no es trivial; una cartera equilibrada (compensaciones) es mucho más probable que tener cada cubo con gran exposición al riesgo en la misma dirección. Sin embargo, si se asume una distribución uniforme, probablemente se puedan obtener resultados, probablemente analíticos.

4) Puede ampliar el punto 3) para determinar, para sus supuestos iniciales, cuál es la combinación óptima de instrumentos de cobertura permitidos para el caso general de una cartera desconocida, dados los supuestos iniciales.

0 votos

Gracias..... Sí, no tengo que usar el PCA. Sólo que quiero reemplazar un análisis de regresión que se hizo antes y que parecía incorrecto (regresión con datos de series temporales y sin tener en cuenta la correlación serial). Tendrá que averiguar cómo utilizar este enfoque en la práctica

3voto

Ramesh Puntos 6909

Para justificar el uso de los tenores 2Y, 5Y, 10Y, 30Y para la agrupación de riesgos, podría analizar hasta los cuatro primeros componentes principales y examinar qué variables resumen mejor la información mostrada en cada eje utilizando la puntuación del factor.

Por ejemplo, si los cuatro primeros componentes principales contienen el 90% de la información disponible (digamos 1er componente principal: 40%, 2do componente principal: 30%, 3er componente principal: 15% y 4to componente principal: 5%) y si los tipos swap 2Y/5Y/10Y/30Y representan respectivamente la mayor parte de la varianza en cada componente principal, entonces el conocimiento de esas variables permite comprender bien la información total contenida en la curva de tipos swap.

También podría hacer un clustering (4 clusters por ejemplo) y examinar qué variable define más su clase.

Sin embargo, en mi opinión, el uso de los plazos (2 años, 5 años, 10 años, 30 años) para la clasificación del riesgo se debe simplemente al hecho de que son los más negociados.

0 votos

"si los tipos de cambio 2Y/5Y/10Y/30Y explican, respectivamente, la mayor parte de la varianza de cada componente principal" - ¿y cómo obtengo esta información? ¿No es la multiplicación matricial de las variables degradadas y las cargas factoriales igual a la matriz de puntuación del factor? ¿Cómo puedo interpretarlo de la manera que usted ha mencionado?

0 votos

Los resultados del ACP proporcionan coeficientes factoriales para cada variable en cada componente que identifican el peso relativo de cada variable en el componente en un análisis factorial. Esos coeficientes se utilizan para calcular las puntuaciones factoriales que he mencionado. Cuanto mayor sea el valor absoluto del coeficiente, más importante será la variable correspondiente en la definición del componente. Creo que esos coeficientes están comprendidos entre -1 y 1 (los veo como una especie de medida de correlación, pero no estoy seguro de ello).

0 votos

Y sí, la matriz de puntuación del factor se calcula como dices. También puedes crear una variable para cada componente principal y estimar un modelo lineal para ver qué variable es relevante en la explicación de un factor

2voto

brad Puntos 119

Desde el punto de vista técnico, asegúrese de que su análisis PCA real es correcto. Una comprobación razonable aquí es trazar las cargas de todos los tenores (no sólo los pocos que le interesan) para los 3 primeros factores y ver si recupera los componentes de nivel, pendiente y curvatura.

Ahora bien, si sus resultados son correctos, el razonamiento es algo así como: los tres primeros componentes principales representan el X% del riesgo (donde X probablemente sea >= 95%). Por lo tanto, se puede traducir cualquier exposición (de cualquier cubo) en una exposición en los 3 primeros componentes. Por último, al elegir un cubo a corto, medio y largo plazo, debería poder minimizar todos los riesgos en los 3 primeros componentes, ya que deberían ser linealmente independientes (si elige 4 puntos y tres componentes, obviamente no lo son).

Ahora bien, lo que el argumento anterior ignora es si la evaluación de riesgos que está haciendo mediante el ACP es suficiente para sus fines. Para fines de gestión de riesgos relativamente sencillos, podría serlo, pero para la gestión de una cartera de tipos en un banco, probablemente no lo sea.

0 votos

Gracias por sus comentarios. El gráfico de las cargas coincide con lo que he visto en la mayoría de los análisis y los tres primeros componentes explican cerca del 97% de la varianza. Sin embargo, no entendí la última parte de tu segundo párrafo. Debo decir que no estoy haciendo esto para la gestión de riesgos. Más bien desde una perspectiva de revisión del modelo en la que necesitamos documentar la prueba de la segmentación utilizada en los ajustes de valoración de la oferta delta.

0 votos

Probablemente añadiré algunos detalles más cuando esté de vuelta en casa. Mi empresa no me permite publicar nada en el intercambio de pila, pero sólo leer (publicar estos comentarios en mi teléfono en este momento)

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X