29 votos

¿Por qué no hay artículos sobre predicción de acciones con aprendizaje automático en las principales revistas financieras?

Estoy escribiendo mi tesis de maestría sobre la predicción del precio de las acciones utilizando métodos de aprendizaje automático. Durante mi revisión de la literatura, me di cuenta de que muchas de las investigaciones realizadas sobre este tema son de baja calidad, publicadas en revistas no relacionadas con las finanzas o no publicadas/revisadas por pares en su totalidad. No hay ningún artículo sobre este tema en las principales revistas, como la revista de finanzas o la revista de economía financiera.

Tengo curiosidad por saber por qué es así. ¿Acaso el mundo académico ha avanzado y simplemente ha aceptado que los mercados son generalmente eficientes hace mucho tiempo? ¿O es que las principales revistas pasan por alto una técnica clave que podría predecir eficazmente el precio de las acciones?

39voto

Charles Chen Puntos 183

Creo que estás pasando por alto una tercera explicación:

Nadie que haya encontrado una técnica exitosa para generar alfa la ha publicado. Se me ocurren las siguientes causas:

  1. Si eres un académico, ¿por qué compartir tu brillante idea?
  2. Estas técnicas requieren muchos datos y los datos financieros pueden ser caros, los investigadores que trabajan en empresas que tienen acceso a estos datos no comparten sus conclusiones con el público.
  3. Los académicos ya encontraron muchas señales a la antigua usanza.

A pesar de esto, las técnicas de lujo como el AAD y Aprendizaje por refuerzo se discuten públicamente. Sin embargo, estos métodos no generan ningún alfa.

32voto

augurar Puntos 135

A principios de la década de 2000 conocí al equipo de Quant de Barclays Global Investors en San Francisco y traté de convencerles de que presentaran algunas de sus investigaciones a la revista que yo dirigía en aquel momento, Quantitative Finance. Esto fue recibido con cierta risa e incredulidad y me dijeron que ellos puede considerar la posibilidad de presentar algunos de los trabajos realizados en la v2 de su modelo, pero que en realidad estaban trabajando en la v9. Hasta ese momento no me había dado cuenta de que la literatura académica sólo araña la superficie de la investigación propia que se lleva a cabo en instituciones de todo el mundo.

25voto

drN Puntos 571

Hay muchos documentos financieros que utilizan el aprendizaje automático

Esto incluye el precio de los activos y el rendimiento de las acciones

Pero en última instancia, no es su trabajo

  • Las principales revistas de finanzas y economía lo hacen no existen para hablar de las mejores estrategias de trading que existen durante unos meses y luego vuelven a desaparecer. Ese no es el objetivo de la economía financiera. Fíjese en la predictibilidad transversal: es muy fácil encontrar factores que predigan los rendimientos. Pero todo el debate en las principales revistas de finanzas gira en torno a los fundamentos económicos que explican por qué y cómo son predecibles los rendimientos de las acciones. Esencialmente, es más fácil entrar en una revista académica con la estimación de un modelo de equilibrio general que explique por qué los rendimientos de las acciones se comportan como lo hacen y no con el ajuste de algún modelo que le da un alfa durante algún tiempo (sin ningún significado económico).

8voto

xrost Puntos 129

Añadiendo a la respuesta de @BobJansen hay algunos adicionales preocupaciones con complejo modelos de aprendizaje automático (por ejemplo, redes neuronales de cualquier tipo y enfoques complejos basados en árboles) que puede encontrar, en el marco de la previsión de la volatilidad (o de la previsión en general) .

  1. Los mecanismos que subyacen a los resultados pueden ser difíciles de explicar: A efectos de previsión, existe una auténtica "desaprobación" de complejo modelos de aprendizaje automático, ya que se tiene una comprensión muy limitada de "lo que sucede bajo el capó" y, por lo tanto, por qué muchos de estos modelos se consideran algoritmos de caja negra. Es más fácil interpretar y comprender lo que ocurre en un modelo GARCH (esto es sólo un ejemplo). Debido a la transparencia del modelo GARCH, podemos resumir las falacias de dicho modelo y mejorarlo, con el fin de incorporar más características estilizadas que se encuentran en el mercado (por ejemplo, el efecto de apalancamiento). Complejo Los modelos de aprendizaje automático son, en general, difíciles de "mejorar", ya que no se tiene la misma transparencia que con el modelo GARCH. Comprender los puntos débiles de los modelos también es clave para entender cuándo se romperán.

  2. El coste de funcionamiento puede aumentar considerablemente: No sólo eso, sino que para mejorar los modelos más clásicos (por ejemplo, GARCH, HAR, etc.) necesitan más datos, lo que aumenta el coste para las empresas que necesitan nuevas fuentes de datos (que pueden ser costosas) sólo para obtener una mejora marginal de la previsión global. Esto pone en tela de juicio que la mejora marginal (en cualquier caso) merezca la pena por el aumento del coste de las licencias de las nuevas fuentes de datos.

  3. ¿Parsimonia? Cuando se construye un modelo de previsión (de cualquier tipo) se quiere respetar el principio de parsimonia: modelos simples con gran poder explicativo y de predicción. Este principio no se cumple realmente cuando tu modelo de aprendizaje automático "funciona" como un algoritmo de caja negra.

Puede haber modelos menos complejos que eludan todo lo anterior definido preocupaciones y aún así tener un gran rendimiento de previsión. Estas son sólo cosas que es bueno tener en cuenta.

7voto

BC. Puntos 9229

Estaba debatiendo si debía comentar esto pero luego pensé esta noche me lo voy a pasar muy bien .

Conferencia de JPMorgan sobre el aprendizaje automático en los mercados financieros, París 2019 ofrece un resumen superficial.

Sencillamente, no tiene los datos necesarios, según mi opinión. Para captar relaciones complejas, se tiende a tener más parámetros, lo que a su vez conduce a una necesidad de datos aún mayor. Cuanto más tiempo pasas con los datos financieros, más te das cuenta de que son notablemente ruidosos. Además, los algoritmos sólo pueden predecir cosas consistentes con lo que han visto antes. No es mi respuesta, pero aquí hay una excelente resumen.

Además, tenga en cuenta que la predicción de valores es un concepto muy amplio. ¿Hablas de alguien que apenas mantiene una acción durante unos segundos? ¿O quiere predecir los precios de las acciones mañana, dentro de 3 meses o 10 años?

Parece que la mayoría de las respuestas se centran en la idea de que alguien con un "modelo" rentable no querría compartirlo con el público. Hablando de datos, empíricamente, me parece que los unicornios, planeta 9 y agujeros negros primordiales y estas personas tienen algo en común. La gente (con los unicornios son sobre todo niños, con los alfa menos, los planetas y los agujeros negros parecen fascinar a adultos y niños por igual) tiende a hablar siempre de ellos, pero nadie ha visto uno de verdad.

Por supuesto, hay Rentec pero, por lo general, eso también se aplica a su Fondo del Medallón ya que sus fondos abiertos suelen tomar un venciendo a . Tradebot y otros, pero no hay muchos que hagan algo como este . Esta pregunta va de la mano con el resumen antes mencionado que afirma que muchos cambios en los precios son impulsados por noticias como un avión que se estrella, ataques terroristas, brotes de virus, tweets de Elon Musk o POTUS, anuncios de fusiones, y similares. Aprender cualquier patrón de estos eventos puntuales es probablemente más engañoso que útil.

Siendo realistas, el resultado se parece más a así que . Alerta de spoiler, buena suerte para encontrar períodos o estrategias que superen al S&P500. En palabras de Warren Buffett "He hablado con grandes fondos de pensiones, y les he llevado a través de las matemáticas, y cuando me voy, salen y contratan a un montón de consultores y les pagan un montón de dinero. Es increíble".

Índices S&P Dow Jones tiene buenos datos. El ejemplo canadiense es un caso extremo. A 31 de diciembre de 2020, el 98,63% de los fondos tenían un rendimiento inferior al S&P/TSX Composite. Sin embargo, los datos de Estados Unidos tampoco parecen especialmente buenos. Juego de palabras es malo y está empeorando. ¿Tal vez debido a la aparición de la LD? Para los lectores que no hablen alemán, ese artículo afirma que el VIH puede estar relacionado con catalizadores . Evidentemente, es una completa basura, pero cuando miras al abismo, el abismo te devuelve la mirada (la correlación no implica causalidad; espurio, confusión, lo que sea).

Es difícil encontrar pruebas contra la HME y encontrar algunos "unicornios" no es prueba suficiente. Sospecho que pueden ser capaces de conseguirlo, sin necesidad de pura suerte. Aunque estadísticamente, esto último no puede descartarse por completo, dado el número de personas que intentan ser más astutas que el ciudadano medio. Sin embargo, al observar estas empresas, o bien emplean la tecnología para dejar atrás a la competencia (no sé nada de la F1, pero Bahrein el año pasado demostró que las herramientas importan más que el artesano) o algunas de las personas más inteligentes de la tierra, que hacen cosas intelectualmente, con las que yo no podría ni soñar. Con frecuencia, una cosa va de la mano de la otra. Así que decir que el Universo DC de las finanzas.

Nick Patterson da una buena visión general sobre lo que hicieron en Rentec, que es principalmente una simple regresión en su opinión (todo el podcast comienza a las 16:40, Rentec comienza a las 29:55 - una frase antes de eso es útil).

Este Correo electrónico: tiene un buen resumen de algunas ideas "básicas" para dominar la HFT. Creo que es el único dominio en el que se puede ganar consistentemente, pero los usuarios son como Lewis Hamilton. Los mejores en su campo, con la mejor maquinaria del planeta. Principalmente, porque tienes muchos más datos y el potencial para explotar la superioridad tecnológica. Compare los datos de ticks de FX con +1 millón de comillas en un día cualquiera para pares de divisas líquidos frente a 10 años de datos diarios. Si usted está en esto para el largo plazo, estos ticks serán inútiles. Si tiene acceder a a la baja latencia de más de 20.000 órdenes por segundo por un solo FIX, que es escalable para aumentar el rendimiento y la latencia de ida y vuelta de menos de un milisegundo, el juego será diferente. El sistema InfoReach sitio web parece estar diseñado a gusto de Buffett, sin desperdiciar recursos para quedar bien (aunque nunca los necesitaría).

El resto de los mortales acecha en el fondo y observa con incredulidad. Kenneth Rogoff y Richard Meese recibió una reacción incrédula a su ahora famoso artículo que mostraba que las previsiones de la marcha aleatoria (RW) superan a los modelos económicos de los tipos de cambio. Las reacciones fueron del tipo "no es posible que lo hayan hecho bien" o "los resultados son obviamente basura". Rogoff plantea una cuestión interesante. Después de todo, si la oferta monetaria es difícil de predecir, no hay que culpar a los modelos si los tipos de cambio son difíciles de predecir. De nuevo noticias imprevistas que importan. Ignoremos que su hallazgo fue aún más extremo. Probaron a predecir el tipo de cambio en un año, dada la información sobre lo que van a ser la oferta monetaria, los tipos de interés y la producción en un año. Sin embargo, incluso en este caso, ningún modelo económico supera al RW.

Ese documento se publicó en una época en la que Warren Buffett a menudo empequeñecía los rendimientos del S&P500. Sin embargo, hoy en día, la oferta de capital que persigue el rendimiento se ha ampliado drásticamente. Buffett ya no proporciona rendimientos dispares según la habitual primera página de la carta anual a los accionistas de Berkshire en la que se compara el rendimiento anual de Berkshire con el del S&P 500.

Así que para resumir, creo que puede funcionar para HFT, pero los usuarios son como Lewis Hamilton. Los mejores en su campo, con la mejor maquinaria del mundo. Sobreajustar datos pasados ruidosos e irrelevantes no suele ayudar mucho. Sé que mucha gente no estará de acuerdo, pero la evidencia empírica tiende a apoyar mis afirmaciones. ¿Es todo esto una mala noticia? En realidad, no. Si un subyacente sigue un camino aleatorio, por ejemplo, Black Scholes y todos sus "derivados" será probablemente más útil. Probablemente también una razón por la que se sigue utilizando para casi todo (al menos en algún lugar bajo el capó).

PS Disculpas por todas las referencias, simplemente me lo he pasado muy bien.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X