20 votos

Utilización de los bosques aleatorios en el análisis cuantitativo de las existencias

Tengo una pregunta sobre los bosques aleatorios y cómo podrían utilizarse en el comercio. He oído que los bosques aleatorios se utilizan para la clasificación, ¿es eso cierto? Si es así, ¿podría alguien dar un ejemplo de qué tipo de clasificación ayuda?

Si no es así, ¿para qué se utilizan los bosques aleatorios en las finanzas cuánticas?

0 votos

Considere la posibilidad de registrarse en el sitio.

15voto

penti Puntos 93

Recientemente asistí a una presentación del primer autor del siguiente artículo que nos dio un (tipo de meta-)uso bastante creativo de los bosques aleatorios en Finanzas Cuánticas:

No es oro todo lo que reluce: Comparación del rendimiento de backtest y fuera de muestra en una gran cohorte de algoritmos de negociación (marzo de 2016)
por Thomas Wiecki, Andrew Campbell, Justin Lent, Jessica Stauth (todos Quantopian)

Resumen:

Cuando las estrategias de negociación automatizada se desarrollan y evalúan utilizando de los precios históricos, existe una tendencia a a ajustarse demasiado al pasado. Utilizando un conjunto de datos único de 888 estrategias de negociación algorítmica desarrolladas y probadas en la plataforma Quantopian con al menos con al menos 6 meses de rendimiento fuera de la muestra, estudiamos la prevalencia e impacto del sobreajuste en el backtest. En concreto, descubrimos que las métricas de evaluación de backtest más comunes, como el ratio de Sharpe ofrecen poco valor para predecir el rendimiento fuera de la muestra (R² < 0.025). En cambio, los momentos de orden superior, como la volatilidad y la reducción máxima, así como las características de construcción de la cartera, como la cobertura, muestran un valor predictivo significativo de importancia para los profesionales de las finanzas cuantitativas. de las finanzas cuantitativas. Además, de acuerdo con las consideraciones teóricas anteriores de las consideraciones teóricas anteriores, encontramos pruebas empíricas de sobreajuste: cuanto más más backtesting ha hecho un quant para una estrategia, mayor es la mayor es la discrepancia entre el rendimiento del backtest y el rendimiento fuera de la muestra. Por último, mostramos que al entrenar clasificadores de aprendizaje automático no lineal en una de características que describen el comportamiento del backtest, el rendimiento fuera de la muestra de la muestra, se puede predecir el rendimiento fuera de la muestra con una precisión mucho mayor (R² = 0,17) en en los datos de hold-out en comparación con el uso de características lineales y univariantes. A cartera construida a partir de las predicciones de los datos de hold-out se comportó significativamente mejor fuera de la muestra que una construida a partir de algoritmos con los ratios de Sharpe más altos del backtest.

Así que lo que hicieron básicamente fue tomar todo tipo de algoritmos de trading cuánticos reales y plantear la vieja pregunta de la HME de si el rendimiento dentro de la muestra tiene algún poder predictivo para el rendimiento fuera de la muestra. Calcularon todo tipo de medidas para estos algoritmos y las utilizaron (y sus combinaciones) para predecir el rendimiento fuera de la muestra. A continuación, extrajeron las características más importantes del modelo de bosque aleatorio: la siguiente imagen está tomada del documento (p. 9)

enter image description here

2 votos

Interesante actualización, gracias por compartir @vonjd

6voto

Enrico Puntos 289

Al igual que con muchas tecnologías de aprendizaje automático, se puede ejecutar una fase de entrenamiento y prueba por separado antes de desplegarlo en vivo para la predicción. Todo lo que hace es construir una colección de árboles de decisión basados en los parámetros que le das: si el campo de salida es un factor, obtienes una clasificación (un conjunto finito de valores enumerados); si es numérico, obtienes una predicción. Un enfoque podría ser añadir una columna para saber si una materia prima alcanza un determinado nivel de beneficios dentro de un periodo de tiempo asequible; el bosque aleatorio puede entonces construir una lógica para correlacionar eso con todas las demás columnas de entrada (como los indicadores técnicos, etc.).

5voto

Markus Olsson Puntos 12651

No he utilizado bosques aleatorios, pero sé de un tipo que aplicó esta técnica de clasificación a los algoritmos de aprendizaje automático aplicados al reconocimiento de patrones.

Por lo tanto, creo que sus ventajas sobre los enfoques de regresión clásicos pueden aplicarse para discernir patrones en los datos financieros, aunque tengo la impresión de que se ajusta en exceso a los datos y, por lo tanto, se termina con la clásica disyuntiva a la que se enfrentan muchos cuantos.

También he leído que es utilizado por la SEC donde lo aplican en su búsqueda de analizar los patrones de negociación para señalar las violaciones de información privilegiada.

0 votos

¿tiene una fuente para eso por casualidad?

4voto

Hace un tiempo he implementado un bosque de árboles de decisión difusos binarios para clasificar las solicitudes de crédito como un proyecto semestral.

Digamos que un árbol tiene este aspecto:

C1
   C11
      -> X
      -> Y
   C12
      C121
         -> A
         -> B
      -> U

Las ventajas de las técnicas de árboles de decisión en general son:

  • Comprensibilidad : Los caminos del árbol tienen una interpretación directa: "Si la condición C1 y la condición C11 entonces X". Por ejemplo, "Si la deuda>0 y los ingresos == 0 entonces no_crédito".
  • Conocimiento experto : Es posible cambiar los árboles en función de los conocimientos previos.
  • Extensibilidad : Es posible incluir otras herramientas de clasificación en los nodos, por ejemplo se podría tener una red neuronal que detecte tendencias y luego bajar por el árbol en función de la salida de la red.

Los bosques de árboles de Decición tienen beneficios adicionales:

  • Adaptación : Si el problema se divide en varios dominios, los árboles pueden ajustarse más a su región.
  • Árboles más pequeños : Los árboles pueden limitarse a un tamaño mucho más pequeño, lo que facilita su comprensión.
  • Información de confianza : Si muchos de los árboles del bosque votan por la misma clasificación, esto puede considerarse una medida de confianza.

El inconveniente es que los bosques pueden ser mucho más caros de calcular y gestionar. Además, mientras que un árbol único puede evitar el sobreajuste mediante técnicas de poda estándar, no parece haber consenso sobre cuál es el mejor enfoque para los bosques, todavía.

Cualquier aplicación de las técnicas de aprendizaje automático de este enfoque sólo es tan buena como los datos y los indicadores utilizados para entrenarla.

Entre los documentos interesantes se encuentran

2voto

WalterJ89 Puntos 175

Podría ayudar con cosas como la detección de fraudes, el análisis de la probabilidad de quiebra, el riesgo de impago, el aprendizaje no supervisado con fines cualitativos/descriptivos, o para un análisis supervisado puramente retrospectivo sobre los rendimientos, de nuevo con fines descriptivos/de comprensión (variable importante, etc., tal vez el análisis de respuesta al impulso).

También puede ser bueno para pronosticar la volatilidad de baja frecuencia, que se sabe que es fácil de pronosticar; intuitivamente, esto funciona porque es probable que haya combinaciones de eventos que causen una volatilidad muy alta, que es difícil de incorporar en una ecuación de varianza GARCH. Se podría confiar en el bosque para aprender los regímenes, las rupturas, etc. (considere un bosque dinámico).

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X