Estoy obteniendo datos de mercado de precio de compra/venta y volumen de dos fuentes diferentes para el mismo ticker y para el mismo día y comprobando que en los intervalos de tiempo X son "aproximadamente iguales". Sin embargo, las marcas de tiempo de las dos fuentes diferentes no son exactamente iguales, por lo que lo que estoy haciendo es volcar el precio cada vez que las marcas de tiempo abarcan un segundo diferente del día. A veces el precio varía entre ese segundo, a veces no, pero en cualquier caso vuelco la forma en que se ve al principio de ese segundo (o milisegundo). Después de hacer esto para ambas fuentes, hice un simple gráfico de los resultados y las cosas se ven consistentes gráficamente:
Las marcas de tiempo no siempre se alinean, aunque cuando intersecciono las columnas de marcas de tiempo y obtengo un subconjunto de las observaciones, y las cruzo obtengo valores relativamente pobres. Peor en las granularidades más altas, probablemente debido a las discrepancias de las marcas de tiempo. No estoy seguro de si debería mirar alguna otra métrica para convencerme de que ambas fuentes me están proporcionando información similar sobre la demanda/oferta a lo largo del día, o cuál es la metodología adecuada para comparar estas dos series temporales entre sí. ¿Es la cointegración entre ellas lo que estoy buscando? Lo que me interesa confirmar es que, suponiendo que la primera fuente me proporcione datos precisos a partir de los cuales construyo mi visión de la oferta/demanda a lo largo del día, la segunda fuente no esté demasiado equivocada.