5 votos

Previsión de los depósitos sin vencimiento con aprendizaje automático

Necesito hacer una previsión de los depósitos sin vencimiento en un banco. Mi intención es utilizar redes neuronales recurrentes (también conocidas como aprendizaje profundo) para modelar series temporales.

El modelo aprenderá de los datos bancarios del pasado y de las variables macroeconómicas, y pronosticará los depósitos en los próximos tres años basándose en las variables proyectadas.

Dos preguntas:

  1. ¿Ves algún problema en este enfoque?
  2. Creo que utilizando esta técnica no es necesario calcular el nivel de los depósitos básicos para prever los depósitos totales, ¿es esta suposición correcta?

3 votos

Oí hablar de una gran institución que había puesto a trabajar a mucha gente con doctorados para intentar utilizar IA/ML para predecir NMD, beta de depósito y cosas por el estilo. Su modelo funcionó tan mal que se abandonó el proyecto, se despidió a mucha gente y la institución es ahora más escéptica ante las modas pasajeras.

0 votos

¿Oíste también cuál era el motivo?

1 votos

Las predicciones del modelo para periodos fuera de la muestra eran demasiado diferentes de la realidad.

9voto

Chris Mc Puntos 31

Esto se reduce a la previsión de series temporales, que es especialmente difícil en el caso de los datos financieros, ya que las finanzas presentan todas las características que dificultan la previsión: no son estacionarias, tienen una baja relación señal-ruido, etc.

En el caso de la previsión de depósitos, dudo mucho que pueda obtener resultados satisfactorios aunque consiga averiguar todas las variables relevantes. Y entonces tendrás un problema llamado maldición de la dimensionalidad porque nunca tendrás millones o miles (o incluso cientos) de datos para entrenar tu modelo.

Una cosa que hay que tener en cuenta sobre los algoritmos de aprendizaje automático en general es que son (pueden ser) muy buenos interpolando y bastante malos extrapolando, lo que significa que tu modelo fallará cuando más lo necesites.

Así que mi respuesta a tu pregunta "¿Ves algún problema en este enfoque?" es que puedes obtener previsiones correctas cuando no importa, es decir, cuando los depósitos no cambian realmente, pero las previsiones pueden fallar estrepitosamente cuando te encuentras en territorios desconocidos.

Y esto se aplica a la previsión con unos pocos meses de antelación... no digamos ya con tres años.

Respecto a la segunda pregunta, yo probaría con y sin depósitos de núcleo para ver si hay algún poder explicativo.

Una referencia útil para empezar sería el tutorial de tensorflow sobre previsión de series temporales que utiliza redes neuronales convolucionales y recurrentes para predecir el tiempo. Podrías intentar utilizarlo con tus datos para pronosticar periodos fuera de muestra.

https://www.tensorflow.org/tutorials/structured_data/time_series

1 votos

Estoy de acuerdo con la respuesta y comprendo por qué modelizar NMD con ML será muy difícil o no dará resultados. Preferiría construir un modelo a medida e intentar ajustarlo.

0 votos

He leído en un documento de Moody's que utilizan el análisis de regresión para predecir los depósitos bancarios, ¿cómo es eso mejor/más preciso que RNN?

4voto

mejpark Puntos 111

Respondiendo a la primera pregunta y basándose en los comentarios de Dimitri, probablemente merezca la pena que hagas un poco de investigación sobre algunas de las cuestiones estándar que surgen en el ML financiero y veas hasta qué punto se aplican a tu problema:

  1. Interpretabilidad: ¿Cómo interpretarás los resultados de tu modelo de Deep Learning y los compartirás con los usuarios/tomadores de decisiones?
  2. Necesidad de datos: Los algoritmos de aprendizaje profundo están hambrientos de datos. ¿Tiene suficientes datos para calibrar el modelo? Dado que los conjuntos de datos históricos rara vez son adecuados, ¿tiene un proceso de simulación robusto para generar datos sintéticos y así tener una idea de cómo se comporta el modelo en varios escenarios económicos?
  3. Relación señal/ruido: Los conjuntos de datos financieros son conocidos por tener una baja relación señal-ruido. ¿Su algoritmo de ML tiene en cuenta los cambios macroeconómicos en la estructura del sector, las medidas reguladoras, etc.?
  4. Ajuste por encima/por debajo: ¿Cómo se controlan los efectos de las series temporales al construir los conjuntos de datos de entrenamiento, validación y prueba?

Por supuesto, estas cuestiones no son exclusivas de los modelos ML. Puede resultarle útil construir un "adversario" de referencia para su modelo utilizando algún enfoque econométrico estándar y, a continuación, comparar y contrastar su rendimiento con respecto a las consideraciones anteriores (entre otras). Tampoco hay que encerrarse en un enfoque de "uno u otro", los conjuntos de modelos suelen dar mejores resultados que cualquier modelo individual, aunque volvemos a caer en cuestiones de interpretabilidad.

Aunque se centra específicamente en la fijación de precios de los activos, puede resultar útil leer el libro de López de Prado Avances en el aprendizaje automático financiero que, además de referirse a estas cuestiones y discutir cómo abordarlas, también habla de cómo estructurar un proyecto de ML financiero.

0 votos

Gracias por tu respuesta, sin embargo se aplica a los modelos de aprendizaje automático en general. La pregunta es específica: ¿se pueden modelar los depósitos con Redes Neuronales Recurrentes? Por cierto, gracias por señalar el libro, es muy interesante.

0 votos

No conozco ningún estudio específico sobre este tema, pero la razón por la que he intentado responder a esta pregunta de forma general es que, según mi experiencia, en un contexto empresarial es poco probable que haya una respuesta simple de "sí-no". En su lugar, normalmente hay que considerar una serie de ventajas y desventajas, algunas de las cuales se mencionan más arriba. En retrospectiva, he interpretado la pregunta nº 1 de forma más general de lo que pretendía.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X