Voy a suponer que al analizar el "deslizamiento" te refieres a los costes de las transacciones.
Analizar la latencia
En primer lugar, diré que analizar los problemas de latencia es increíblemente difícil. Probablemente ni siquiera sepa dónde se ubicará su estrategia: ¿colocada? ¿no colo pero cerca? Tampoco sabe a qué velocidad responderá su algoritmo a una señal: ¿milisegundos? ¿micro? nanos? Por ejemplo, la colocación en el CME del software de Trading Technologies en un servidor compartido puede lograr a veces tiempos de respuesta en el rango de 100-300 microsegundos. Sé que hay otros programas que responden en el rango de los milisegundos.
Yo no me metería demasiado en el análisis de la latencia, aparte de (tal vez) comparar diferentes programas o corredores.
Estimación de los diferenciales entre la oferta y la demanda
Puede parecer inútil analizar el deslizamiento, pero no es así. Hay algunos artículos excelentes sobre la estimación de los diferenciales entre oferta y demanda a partir de los datos de cierre diario o de OHLCV.
Rollo (1984)
En primer lugar, podría utilizar Roll's (1984) trabajar en los diferenciales de oferta y demanda y estimar los diferenciales como $\sqrt{-\textrm{cov}(r_t,r_{t-1})}$ .
Zhang, Mykland y Aït-Sahalia (2005)
También puede consultar Zhang, Mykland y Aït-Sahalia (2005) El trabajo de TSRV, que estima las varianzas, tiene que corregir la "contaminación por ruido de microestructura" causada por el rebote entre oferta y demanda. Tienen una corrección sustractiva: su estimador ajustado de "escala rápida" $\frac{\bar{n}_k}{n-\bar{n}_k}\sum_{i=1}^n r_i^2$ . Se podría utilizar como algo similar a la $2c^2$ en el modelo de Roll.
Corwin y Schultz (2012)
Otro enfoque sería utilizar Corwin y Schultz (2012) para estimar las volatilidades y los diferenciales entre oferta y demanda a partir de los datos de OHLCV. Su método es un poco más complicado, pero tiene cierto razonamiento económico: asumen que los precios altos se ejecutan probablemente en la oferta y los precios bajos se ejecutan probablemente en la demanda.
A continuación, observan los máximos y mínimos de períodos de uno y dos días. Estiman un "rendimiento logarítmico" diario medio al cuadrado desde el mínimo hasta el máximo ( $\log(H_t/L_t)$ ) y el "log-return" de dos días al cuadrado desde el mínimo hasta el máximo de dos días. $$ \begin{align} \hat\beta &= \frac{1}{n/2}\sum_{j=1}^{n/2}\sum_{i=2j-1}^{2j} [\log(H_i/L_i)]^2, \\ \hat\gamma &= \frac{1}{n/2}\sum_{j=1}^{n/2} \left[\log\left(\frac{\max(H_{2j-1},H_{2j})}{\min(L_{2j-1},L_{2j})}\right)\right]^2. \end{align} $$ Esto les permite resolver un sistema de ecuaciones, ya que la varianza escala linealmente con el tiempo, mientras que se supone que el diferencial entre oferta y demanda es constante en ambos días: $$ \begin{align} \beta &= 2k_1\sigma^2 +4k_2 \sigma \alpha + 2\alpha^2, \quad \text{and}\\ \gamma &= 2k_1\sigma^2 +2\sqrt{2}k_2 \sigma \alpha + \alpha^2 \quad \text{where} \\ \alpha &= \log\left(\frac{2+S}{2-S}\right), \quad S = \text{spread}, \\ k_1 &= 4\log(2), ~\text{and} \quad k_2 = \sqrt{\frac{8}{\pi}}. \end{align} $$
Abdi y Ranaldo (2017)
Por último, puede intentar Abdi y Ranaldo (2017) método. Asumen, como Corwin y Schultz, que los máximos están en la oferta y los mínimos en la demanda. Sin embargo, también utilizan los precios de cierre y suponen que existe un precio eficiente para los mínimos, los máximos y los precios de cierre $l_t^e, h_t^e, c_t^e$ . A continuación, asumen la media de los mínimos y máximos eficientes $(l_t^e+h_+t^e)/2$ es una estimación justa del cierre eficiente (aunque con algo de ruido del proceso de precios eficientes). Además, señalan que los precios máximos y mínimos observados pueden promediarse, ya que el más y el menos de un medio diferencial se anula. Así, $$ \eta_t = \frac{l_t^e + h_t^e}{2} = \frac{l_t + h_t}{2}. $$
A continuación, señalan que $E(\frac{\eta_t + \eta_{t+1}}{2}) = E(c_t^e)$ . Por lo tanto, la varianza de $\eta$ cambios estima la varianza eficiente de los precios $\sigma_e^2$ y la varianza de $c_t$ frente a la media de $\eta$ depende de ambos $\sigma_e^2$ y la difusión $S$ . Eso da un sistema de ecuaciones que se resuelve fácilmente (puesto que ya es triangular): $$ \begin{align} E[(\eta_{t+1}-\eta_t)^2] &= \left(2-\frac{k_1}{2}\right)\sigma_e^2, \quad \text{and} \\ E\left[\left(c_t-\frac{\eta_t+\eta_{t+1}}{2}\right)^2\right] &= \frac{S^2}{4} + \left(\frac{1}{2} + \frac{k_1}{8}\right) \sigma_e^2 \end{align} $$ donde $k_1=4\log(2)$ como en el método de Corwin y Schultz.
Análisis de las desviaciones
Una vez que tenga las estimaciones de los diferenciales de compra y venta y de las volatilidades, puede intentar fácilmente ajustar sus operaciones o rendimientos a varios modelos de impacto de precios. Aunque podría escribir mucho sobre ellos, me limitaré a autoplagiar y sugerir la respuesta aquí para guiarle en el uso de sus estimaciones de diferencial y volatilidad.
0 votos
Dices que quieres analizar la latencia/deslizamiento sin datos de la cartera de pedidos (y mencionas los datos OHLCV). ¿Significa eso que también podría utilizar intradía comercios sin la cartera de pedidos? Las respuestas que tienes hasta ahora están asumiendo datos OHLCV, pero si puedes utilizar operaciones intradía entonces se pueden obtener resultados mucho más nítidos.