Se pueden encontrar muchos artículos buenos simplemente escribiendo palabras clave como "deep reinforcement learning finance" en arXiv o Google Scholar o buscando en los sitios web de los principales investigadores, lo que proporciona un exceso de aplicaciones y direcciones de investigación con las que comprometerse. De todos modos, aquí hay algunos que se me ocurren:
Si buscas un artículo de nivel más introductorio, esta tesis de maestría aplicó el aprendizaje de refuerzo distribucional al problema de la ejecución óptima y proporciona un código que es bastante raro y agradable: https://www.imperial.ac.uk/media/imperial-college/faculty-of-natural-sciences/department-of-mathematics/math-finance/TobyWestonSubmission.pdf
Si quieres un trabajo más completo y reciente, me gustó "Optimal Execution of Foreign Securities" de Cartea & Arribas, que fue una aplicación única del aprendizaje automático a la negociación óptima en el mercado de divisas: https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3562251 . Rama Cont y Justin Sirgnano escribieron un breve artículo allá por 2018 con respecto al problema de la detección de la formación de precios utilizando el aprendizaje profundo: https://arxiv.org/pdf/1803.06917.pdf . Charles Lehalle también tiene algunos trabajos interesantes sobre no tanto el aprendizaje profundo, sino el aprendizaje de refuerzo que podrías encontrar en su página de Google Scholar: https://scholar.google.com/citations?hl=en&user=j44WqxsAAAAJ&view_op=list_works&sortby=pubdate . Me gustó mucho este artículo de Zhang et al (2019) sobre el aprendizaje profundo para predecir también la formación de precios - se trató con mucho detalle e incluyen un montón de citas si quieres mirar un poco más: https://ieeexplore.ieee.org/abstract/document/8673598?casa_token=eealOPwLJEEAAAAA:B6eolFGeLCcidoJOLG_VUXPcBnHqKVXeNapUeHzME7A5VlG6g8PEKWjxAtWuQakSlxiMoOnf-g . Mientras que usted pidió el aprendizaje de refuerzo profundo, aquí hay una aplicación de q-learning a la fijación de precios de las opciones (hay muchos más): https://arxiv.org/pdf/1712.04609.pdf .
También puede encontrar documentos más antiguos, pero todavía interesantes, como https://ieeexplore.ieee.org/abstract/document/8324237?casa_token=FXpE__5nGKwAAAAA:lgEhAx_r2-2B3My1HgzP8dJshgF2XFM88PyI6dRs23GMwg-sOl-P3NcJSuKV01_oaqKM9pPSYg que aplica el aprendizaje de refuerzo profundo al comercio de criptomonedas - advertencia: lleno de errores tipográficos la última vez que lo leí.
3 votos
Su título dice "aprendizaje por refuerzo", pero su texto exige "aprendizaje por refuerzo profundo". La RL puede ser suficiente para muchos problemas en las áreas que has especificado. Tal vez quieras aclarar cuál necesitas.