Estoy trabajando en la siguiente tarea:
Dados datos trimestrales:
- una serie temporal que representa las tasas de incumplimiento realizadas de 1 año (10 años de datos) en una cartera de hipotecas
- una serie temporal macroeconómica realizada (10 años de datos). Cada serie temporal puede ser relevante o no
- Un escenario de estrés de esas mismas series temporales macroeconómicas durante 2 años
Estimar la probabilidad de incumplimiento utilizando los datos de estrés.
En realidad, no sé nada sobre distribuciones subyacentes. Los únicos datos que tengo para la inferencia son estas series temporales.
Mi enfoque inicial fue algo como esto: primero haría que cada serie temporal fuera estacionaria. Luego eliminaría variables macroeconómicas que no estuvieran correlacionadas de manera significativa con mi variable dependiente. Luego utilizaría un método paso a paso para determinar las mejores variables a utilizar en una regresión lineal. Luego incluiría esas variables exógenas mientras ajusto un modelo ARIMA. En el camino haría varias pruebas (por ejemplo, autocorrelación, multicolinealidad, estacionariedad, etc.). Luego usar ese modelo para la predicción.
Tenga en cuenta que en realidad tengo varios "portafolios" diferentes que estoy ajustando. Utilizando mi procedimiento anterior, algunos de los escenarios de estrés parecen poco razonables. Entonces, comencé a buscar alternativas totalmente diferentes. ¿Hay alguna sugerencia?
Me doy cuenta de que esta es una pregunta demasiado amplia. Para reducir el alcance, he hecho una breve investigación y creo que algunas alternativas viables podrían incluir:
- Calibrar algunas densidades de transición dinámicas utilizando inferencia bayesiana y MCMC
- Calibrar un modelo Vasicek condicional que permita la autocorrelación
El problema es que no estoy muy familiarizado con estos métodos y quisiera hacer un uso eficiente de mi tiempo.
¿Me sugiere que intente implementar estas alternativas? ¿O alguna otra alternativa?
¿Tiene algún consejo para implementar en R?
¡Gracias!