DeepMind han demostrado increíbles capacidades de un agente de aprendizaje de la máquina de refuerzo para jugar competentemente a los videojuegos de Atari. Es muy sorprendente que durante el entrenamiento nada más que los marcos de la imagen del juego y la puntuación se proporcionaron a la deep Q-network
(DQN). El agente aprendió las acciones apropiadas para jugar con precisión un juego y operar de manera competente sin ninguna adaptación específica al código fuente o a los hiperparámetros de la red. Simplemente necesita entrenamiento en un gran número de secuencias de juego para aprender un nuevo juego.
¿Podría adaptarse esta tecnología de manera viable para permitir que un agente de aprendizaje automático tome medidas comerciales competentes y adecuadas en los mercados financieros? Como jugar al Pong, pero con los mercados? ¡Un alto puntaje sería bastante agradable!
¿Alguien tiene experiencia para articular o aconsejar sobre cómo se podría experimentar esto en la práctica?
4 votos
He visto el breve documental sobre DeepMind en Internet. Creo que la razón por la que funcionó en el juego de Atari es porque el videojuego era predecible, la pelota rebota de un lado a otro y la máquina aprende a posicionarse rápidamente para evitar que la pelota caiga... ¡en los mercados qué decir que la pelota no seguirá cayendo!
0 votos
@Rime ¿Permitir que el agente tenga un stop loss como una de las acciones disponibles que puede tomar? En algunos de los juegos de Atari por ejemplo había 18 acciones posibles diferentes. En los mercados financieros podría reducirse a tres, ir largo, ir corto, ir plano?
0 votos
Bienvenido a Quant.SE y gracias por esta pregunta tan interesante. Quizás quieras echar un vistazo a mi respuesta aquí: quant.stackexchange.com/a/969/12