Esto se reduce a la previsión de series temporales, que es especialmente difícil en el caso de los datos financieros, ya que las finanzas presentan todas las características que dificultan la previsión: no son estacionarias, tienen una baja relación señal-ruido, etc.
En el caso de la previsión de depósitos, dudo mucho que pueda obtener resultados satisfactorios aunque consiga averiguar todas las variables relevantes. Y entonces tendrás un problema llamado maldición de la dimensionalidad porque nunca tendrás millones o miles (o incluso cientos) de datos para entrenar tu modelo.
Una cosa que hay que tener en cuenta sobre los algoritmos de aprendizaje automático en general es que son (pueden ser) muy buenos interpolando y bastante malos extrapolando, lo que significa que tu modelo fallará cuando más lo necesites.
Así que mi respuesta a tu pregunta "¿Ves algún problema en este enfoque?" es que puedes obtener previsiones correctas cuando no importa, es decir, cuando los depósitos no cambian realmente, pero las previsiones pueden fallar estrepitosamente cuando te encuentras en territorios desconocidos.
Y esto se aplica a la previsión con unos pocos meses de antelación... no digamos ya con tres años.
Respecto a la segunda pregunta, yo probaría con y sin depósitos de núcleo para ver si hay algún poder explicativo.
Una referencia útil para empezar sería el tutorial de tensorflow sobre previsión de series temporales que utiliza redes neuronales convolucionales y recurrentes para predecir el tiempo. Podrías intentar utilizarlo con tus datos para pronosticar periodos fuera de muestra.
https://www.tensorflow.org/tutorials/structured_data/time_series
3 votos
Oí hablar de una gran institución que había puesto a trabajar a mucha gente con doctorados para intentar utilizar IA/ML para predecir NMD, beta de depósito y cosas por el estilo. Su modelo funcionó tan mal que se abandonó el proyecto, se despidió a mucha gente y la institución es ahora más escéptica ante las modas pasajeras.
0 votos
¿Oíste también cuál era el motivo?
1 votos
Las predicciones del modelo para periodos fuera de la muestra eran demasiado diferentes de la realidad.
0 votos
He oído algo parecido (exbanquero, postgraduado en ciencia de datos). El quid del problema es doble. Los banqueros no entienden de datos; los quants no entienden de banca. Los banqueros dan a los quants diez años de datos, que es una muestra de uno desde la perspectiva del ciclo económico, con cambios masivos en la regulación y los tipos de interés. Los quants que intentan aumentar el tamaño de la muestra >1 mirando a la historia chocan con una ruptura estructural en 2008.
1 votos
Una visión muy relevante de V. Piterbarg: ci.natwest.com/insights/articles/