Una propiedad de los datos de alta frecuencia es que está sujeto a bid-ask bounce.
Descripción : A diferencia de los datos tradicionales basados únicamente en precios de cierre, los datos de ticks llevan información adicional de oferta y demanda en forma de precios de compra y venta y tamaños de oferta.
Como investigador, puede ser una ventaja porque las comillas de compra y venta pueden contener información valiosa sobre movimientos futuros del mercado.
Sin embargo, las comillas de compra y venta están separadas por un spread. El movimiento continuo de la oferta a la demanda y viceversa introduce un proceso de salto, difícil de manejar a través de muchos modelos convencionales.
Actualmente estoy trabajando en un proyecto de trading de alta frecuencia. Al principio, quería predecir el movimiento del precio, pero debido a que el precio no es estacionario y otras razones, el problema resultó ser más difícil de lo que esperaba. Ahora, en lugar de tratar con el precio, trato con los log-rentabilidades en el precio medio (similar al precio estándar) y las características.
¿Por qué estoy hablando de características?
Para el problema autorregresivo, es bien sabido que las RNN-LSTM funcionan bastante bien en un problema de pronóstico de series temporales. Dado que ni los precios medios ni las características son estacionarias, apliqué los log-rentabilidades en todos ellos. Creo que será más fácil abordar la solución a mi problema.
Sin embargo, ahora creo que enfrento el problema de bid-ask bounce. ¿Cómo puedo superar ese contratiempo? ¿Es suficiente el log en el precio medio para hacer frente al problema de bid-ask bounce?