Mirando el libro "Advances in financial machine learning" el autor propone una forma de muestrear datos financieros de alta frecuencia de varias formas que no son sólo las barras de tiempo estándar. Estaba intentando preparar un conjunto de datos para hacer un análisis multivariante utilizando series temporales de varios futuros diferentes. Para ello utilizaría barras de volumen, que se consideran más representativas del flujo efectivo de información que proporciona el mercado y que además tienen propiedades estadísticas deseables como la recuperación de la normalidad, sólo mirando los rendimientos.
Desafortunadamente, cuando creo barras de volumen para diferentes activos dado un umbral de contratos negociados que señala el cierre de la barra, las barras resultantes obviamente no están alineadas. En realidad, cada contrato futuro tiene su propia trayectoria de volumen durante el día, por lo que no hay posibilidad de conseguir que se alineen a tiempo.
Mi preocupación viene cuando se quiere hacer alguna regresión multivariante entre los activos considerados. ¿Cómo puedo resolver el problema de las marcas de tiempo alineadas de forma diferente? ¿Existe una forma habitual de resolverlo en la práctica?
Sospecho que trabajar con barras de volumen (o incluso con barras de ticks/dólares) implica tener que lidiar con el tema de la marca de tiempo.