7 votos

Recuperación de datos de ticks completos a partir de datos de ticks perdidos

Debido a algún problema económico/de régimen, sólo puedo tener acceso a datos no completos de una bolsa.

Para precisar el problema, los datos de una garrapata completa $X$ es una serie de $(t_i,p_i,v_i)$ para $0 \leq i \leq N$ donde $t_i$ es la marca de tiempo, $p_i$ es el precio, $v_i$ es el volumen de operaciones.

Los datos que he podido ver son de menor resolución $\hat{X}$ de $X$ en el sentido de que, sólo puedo observar el mercado en una secuencia $j_1 < j_2 < \ldots < j_m$ y obtener los datos como: (la secuencia no es necesariamente determinista o en intervalo fijo)

$(\hat{t_{j_k}},\hat{p_{j_k}},\hat{v_{j_k}})$ donde $\hat{t_{j_k}} = t_{j_k}, \hat{p_{j_k}} = p_{j_k}$ pero $$\hat{v_{j_k}} = \sum_{i=j_{k-1}+1}^{j_k} v_i$$

Por ejemplo, si los datos verdaderos $X$ es:

$(0,100,1) \\ (1,102,2) \\ (2,101,1)$

Puede que sólo vea la de menor resolución $\hat{X}$ como

$(0,100,1) \\ (2,101,3)$

o

$(1,102,3) \\ (2,101,1)$

La pregunta es..

  1. Supongamos que sólo tengo una fuente de $\hat{X}$ ¿Cuál es la mejor manera de recuperar la mayoría de las garrapatas perdidas? Sé que puede ser una mala pregunta, ya que la información ya se ha perdido. Creo que tengo que añadir alguna suposición de modelo para este problema desde el punto de vista bayesiano, ¿alguna referencia para esto?

  2. Supongamos que tengo dos fuentes diferentes de $\hat{X}$ y debido a la naturaleza aleatoria de los ticks que faltan, dos fuentes serían diferentes. ¿Algún método para recuperarlo?

P.D. Creo que puedo pensar que los datos de la garrapata son una imagen unidimensional, y que los datos de menor resolución son una versión pixelada de los datos de la imagen real, y aplicar alguna técnica de procesamiento de imágenes sobre ellos, ¿alguna idea?

5voto

Greg Hurlman Puntos 10944

Si te faltan garrapatas, ninguna técnica las recuperará.

Si tienes dos fuentes, designa una de ellas como principal y rellena los huecos con la fuente secundaria. Por supuesto, tendrás que tener en cuenta las marcas de tiempo a la hora de determinar si la fuente secundaria se puede utilizar correctamente.

5voto

DShook Puntos 5361

Obviamente, la fusión de dos flujos es inofensiva y debería hacerse. Pero es difícil aconsejarte sobre los métodos de "interpolación" que puedes utilizar para generar los ticks sin saber por qué lo necesitas. La razón es que cualquier método introducirá un cierto sesgo en los datos. Por lo tanto, depende mucho de lo que vayas a hacer con tus datos alterados en el siguiente paso.

Algunos enlaces relativos a los métodos de interpolación que pueden resultarle útiles:

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X