2 votos

¿Existe una forma comúnmente aceptada de aprovechar la granularidad de los datos de alta frecuencia sin dejar de trabajar con las limitaciones de las frecuencias más bajas?

Disculpas si este no es el foro correcto para esta pregunta.

En la actualidad, el acceso a los datos de alta frecuencia (datos de operaciones, datos de comillas, actualizaciones de la cartera de órdenes limitadas, etc.) es relativamente sencillo a través de diversos puntos finales públicos o mínimamente privados (API de criptobolsas, API de intermediarios, etc.).

Parece que sería informativo poder utilizar esta información en estrategias de negociación o análisis que actúen o estén limitados por plazos más largos sin la posible pérdida de información o flexibilidad que puede suponer la reducción del muestreo a barras espaciadas uniformemente en el tiempo o el volumen.

Con la disponibilidad generalizada de datos en tiempo real de tal granularidad, me gustaría saber si existe algún marco común de desarrollo o análisis que yo desconozca y que se preste al análisis/realización de predicciones/toma de medidas/modelización del impacto de dichas medidas/etc. basándose en dichos datos.

Un ejemplo más concreto, Supongamos que partimos de una instantánea del libro de órdenes limitadas de algún activo líquido negociado en una bolsa centralizada y recibimos actualizaciones en tiempo real de los cambios en el LOB a medida que se producen.

En este caso, por el motivo que sea (falta de colocation, latencia, infraestructura, etc.), tenemos un retraso del $\tau$ entre el momento en que se produce realmente la actualización de la LOB y el momento en que nuestra acción decidida llega al intercambio donde $\tau$ es notablemente mayor que el tiempo entre actualizaciones.

En esta situación, ¿hay alguna manera de aprovechar la información contenida en las actualizaciones en tiempo real de forma que se pueda actuar con un retraso de $\tau$ y que, al mismo tiempo, nos ofrezca la flexibilidad de no trabajar exclusivamente con datos de baja frecuencia y/o uniformemente espaciados?

No estoy seguro de si esto va más allá de lo propietario o si la simplicidad dicta simplemente tratar con los beneficios/limitaciones de los datos espaciados uniformemente/de menor frecuencia o limitar nuestro enfoque para evitar acciones que dependen de actuar con un retraso menor que el de los datos espaciados uniformemente/de menor frecuencia. $\tau$ pero, si es posible, cualquier referencia sería muy apreciada.

3voto

J. Allen Puntos 23

Puede extraer señales de baja frecuencia de datos de alta frecuencia y aplicarlas a estrategias de baja frecuencia. Por supuesto, tales extracciones son esencialmente compresiones de datos y normalmente habrá una pérdida de información. Sin embargo, la mayoría de las veces, esta pérdida de información es deseable, ya que para una estrategia de baja frecuencia, la mayoría de las señales de los datos de alta frecuencia son simplemente ruido y no son realmente útiles sin filtrar.

Consideremos el ejemplo de una estrategia de negociación de acciones que se reequilibra diariamente. ¿Contiene un cambio aleatorio de instantánea intradía alguna información útil para predecir la rentabilidad de mañana? Es muy poco probable. Sin embargo, si se calculan algunas estadísticas de la oferta/demanda/cancelación/operación basadas en los datos de L2, es posible que se obtengan algunas señales útiles.

Por lo tanto, podrías convertir tus datos de alta frecuencia en señales de baja frecuencia. Es simplemente un remuestreo, pero tienes que saber hasta qué punto tus datos pueden ser realmente predictivos.

Editar para responder a la pregunta mencionada en los comentarios

Supongamos que originalmente está operando en barras de 1 hora:

Su estrategia se activa cada vez que recibe una barra de la bolsa, y su estrategia sólo puede mirar hacia atrás a las barras anteriores. Digamos que abre una posición larga cuando los precios de cierre de las tres últimas barras son estrictamente crecientes.

Ahora también se suscribe a las actualizaciones del libro de órdenes, y en cada actualización registra el precio medio y puede calcular el precio medio de todos los precios medios instantáneos para cualquier ventana retrospectiva arbitraria. Este precio puede ser mejor o no que el precio medio horario original. O quizás también pueda registrar los desequilibrios de la cartera de pedidos y calcular la media de los mismos. Añadir esto podría ser potencialmente más útil porque añade nueva información a su antiguo conjunto de características. Tenga en cuenta que el cálculo todavía se activa en la barra horaria, simplemente necesita registrar los datos de alta frecuencia en sus actualizaciones.

Al introducir nuevas fuentes de datos, hay que asegurarse de que tienen valores añadidos y seleccionar las formas adecuadas de extraer sus valores. Calcular la media no está mal, pero podría haber mejores métodos de filtrado.

1voto

Jo Liss Puntos 1273

No estoy seguro de si existen modelos formales o trabajos académicos al respecto, pero hay muchos casos de uso de datos L2, independientemente de la frecuencia temporal a la que se genere la señal. Un ejemplo, es que entras en una operación en una barra de 4H pero compruebas el stop-loss o take-profit (o cualquier otra cosa) cada minuto/segundo. Personalmente, lo uso más para la ejecución de órdenes. Supongamos que está ejecutando su estrategia en una barra diaria y desea reducir el impacto de su orden en el mercado, por lo que dividirá su orden en trozos y los enviará a lo largo del tiempo. Pero cada vez que envías la orden tienes que comprobar el estado del libro de órdenes y asegurarte de que el precio está dentro de tu tolerancia de deslizamiento. En otras ocasiones su orden puede ser cancelada/rechazada por diversas razones, por lo que tendrá que acceder al libro de órdenes para reenviar la orden.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X