2 votos

¿Cómo formulas ideas y estrategias de trading?

Tengo acceso a datos de tick y datos de Bloomberg. Fuera de la minería de datos y esperando encontrar una justificación económica después del hecho, ¿qué sueles hacer para generar ideas antes de mirar los datos? Me cuesta pensar en algo fuera de arbitraje, operar pares de activos similares, minería de datos de activos correlacionados, minería de datos de activos que se revierten a la media y minería de "señales" de datos de tick. Tal vez estoy pensando demasiado y la minería de datos realmente funciona. ¿Cuáles son algunas estrategias generales que las empresas realmente emplean en lugar de estrategias adecuadas para el trader personal?

He escuchado sobre cosas relacionadas con el momentum (los últimos 11 meses omiten un mes) y los típicos modelos "factor" como small-big, liquidez, pero eso parece más adecuado para fondos mutuos.

Supongo que otra pregunta es, ¿las empresas realmente hacen mucha minería de datos? Estoy tratando de conseguir un trabajo, así que quiero hacer algo relevante/práctico de lo que pueda hablar en una entrevista en lugar de simplemente "tomé una clase de estadística o vi un video sobre ML".

¿Debería investigar en documentos de investigación aleatorios? Quiero decir, tengo ideas en general, pero solo tengo acceso a algunos datos de tick y Bloomberg, lo cual es bastante limitado ya que solo ofrece valores de cierre que pueden ser un sello de tiempo diferente para diferentes productos/bolsas.

Gracias.

3voto

John Rennie Puntos 6821

Es una pregunta muy amplia, permíteme estrecharla y responder sobre el sobreajuste: ¿cómo puedes evitar que las aplicaciones ciegas de modelos de caja negra solo muestren anécdotas en la muestra?

En primer lugar, vale la pena centrarse en dos términos

  • modelo de caja negra no es obligatoriamente una red neuronal profunda, puede ser una secuencia de promedios móviles, rangos y truncamientos (que es en efecto muy no lineal); un modelo es una caja negra cuando no se puede explicar? aquí encontramos la ambición de Inteligencia Artificial Explicable. Esto no es tan nuevo: cuando utilizas información mutua para medir la relación entre dos variables (una que observas, una que deseas predecir), puedes terminar con la respuesta de que "sí, hay una relación", sin poder exhibir un modelo operativo....
  • anécdotas son simplemente descriptivas y no explicativas. Es como presenciar que "observaste una nueva estrella en el cielo", sin dar una comprensión de las trayectorias de todas las estrellas de este tipo (para tomar una imagen que hablará a los econofísicos). Esto ha sido teorizado por Thomas Kuhn en La Estructura de las Revoluciones Científicas, también ha sido formulado por Shannon y Kolmogorov de una manera más formal: el conocimiento tiene que ver con la "compresión de la información" mientras que las anécdotas son la repetición de información.

¿Cómo puedes evitar estos problemas?

  1. Tener muchos datos: puedes preservar conjuntos de datos fuera de la muestra para probar y luego validar tus modelos. Es por eso que, en finanzas, los datos de ticks son un buen campo de juego: tienes tantas observaciones.
  2. Regulariza tu modelo ya sea por penalización estándar que utiliza el aprendizaje estadístico desde hace mucho tiempo (ver Lasso o Ridge), ya sea por una historia que explique en qué crees que estás aprovechando (la historia debe reflejarse en las variables que seleccionas, la forma en que las procesas y mezclas). Cuantas más restricciones pongas alrededor de tu modelado, más robusto será cualquier cosa que encuentres a pesar de las restricciones.

Permíteme terminar con un ejemplo (sobre datos de ticks), los dos documentos:

El primero es un modelo de caja negra muy bien hecho para predecir algunas características de la dinámica del libro de órdenes. Y el segundo (siendo Justin autor (co)-autor de ambos, por eso el ejemplo es interesante), explica por qué funciona. Puedes considerar el primero como un ensayo técnico, y el segundo como un producto finito. Por supuesto, lo mejor es cuando la explicación ha sido formulada antes de las exploraciones, o cuando la explicación es tan sólida que puede ser (aproximadamente) probada con modelos más simples.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X