3 votos

Limpieza de datos de alta frecuencia

En el documento "Realized kernels in practice: trades and quotes" de O. E.Bandorff-Nielsen etc. cf.

https://onlinelibrary.wiley.com/doi/full/10.1111/j.1368-423X.2008.00275.x

en la sección dedicada a la limpieza de datos los autores sugieren:

Retain entries originating from a single exchange (NYSE in our application). 
Delete other entries.

Está relacionado con los datos de las operaciones y las comillas.

¿Por qué no deberíamos tener en cuenta los datos de otras bolsas?

1 votos

Hola: los datos de los ticks son muy complicados de tratar (pueden ocurrir muchas cosas, como cancelaciones, las marcas de tiempo de los ticks pueden ser extrañas, etc.), por lo que, al restringir su análisis a los ticks de una bolsa, la complejidad de los datos de los ticks disminuye, pero siguen siendo complicados. lo más probable es que se refieran a las operaciones, porque las comillas, según mi experiencia, son menos complicadas.

3voto

Greg Hurlman Puntos 10944

Los autores explican la razón más adelante:

Se utiliza para reducir el impacto de los retrasos en la notificación de las operaciones y las actualizaciones de las comillas.

Debido a la velocidad de la luz, las marcas de tiempo de los datos de las bolsas externas tendrán un significado diferente de las marcas de tiempo de los propios datos de NYSE. Por ejemplo, una actualización de precios en NASDAQ se producirá unos milisegundos antes de que NYSE la observe.

Los autores pasan a considerar la modelización en una bolsa frente a todas las bolsas. Dado que el volumen de la NYSE por sí solo es menor que el de todas las demás bolsas juntas, tiene sentido considerar el conjunto. Los investigadores tendrán que sopesar la facilidad de una bolsa frente a la imagen más completa que se obtiene de todas las bolsas.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X