La regla 605 de la SEC de EE. UU. define el "spread realizado promedio" como el promedio ponderado por acción de los spreads realizados para las ejecuciones de órdenes calculado, para las órdenes de compra, como el doble de la diferencia entre el precio de ejecución y el punto medio de la mejor oferta y demanda consolidada cinco minutos después del momento de la ejecución de la orden, y para las órdenes de venta, como el doble de la diferencia entre el punto medio de la mejor oferta y demanda consolidada cinco minutos después del momento de la ejecución de la orden y el precio de ejecución.
$$ \text{ARS} = \frac{2 \left(\sum\limits_{i\in\text{Buy}} \text{shares}_i \left(\text{price}_{i} - \text{mid}_{\text{time}(i) + 5}\right) +\sum\limits_{i\in\text{Sell}} \text{shares}_i \left(\text{mid}_{\text{time}(i) + 5} - \text{price}_{i}\right)\right)}{\sum\limits_{i=1}^n \text{shares}_i } $$ Su conjunto de datos no tiene el detalle a nivel de transacción requerido para la suma anterior.
nbbo2
apunta a Corwin y Schultz. En la sección 1 de Corwin y Schultz,
Mientras que el componente de varianza crece proporcionalmente con el período de tiempo, el componente del spread no lo hace.
Una simple regresión separará estos dos componentes (varianza debido al cambio en el spread medio, y varianza alrededor del spread medio). Por ejemplo, con datos por minuto, considere la regresión:
$$ \begin{align} \text{Ajuste} \quad \left( \text{close}_{t} - \text{vwap}_{(t+s)}\right)^2 \quad &\text{por} \quad s +\text{constante}\quad\forall t, ~s \in 0, 15,30,60,\ldots \\ \text{Ajuste} \quad y &= mx + b \\ \hat{m} &= \text{varianza estimada del spread medio / minuto} \\ \hat{b} &= \text{varianza estimada alrededor del spread medio} \\ \sqrt{\hat{b}} &= \text{desviación estándar estimada de los precios de ejecución debido a ARS} \end{align} $$
En la terminología del modelo de espacio de estados, la distinción aquí es entre la varianza de evolución que afecta el spread medio con el tiempo y la varianza de observación que afecta una ejecución individual instantáneamente. Ver West, Mike, y Jeff Harrison. "El modelo lineal dinámico." Pronóstico bayesiano y modelos dinámicos (1997): definición 1.1.
Los mínimos cuadrados ponderados podrían incluir datos de volumen: $$ \begin{align} i &= \text{enumera las observaciones } \forall s,t\\ w_{i,i} &= \text{shares}_i,\text{ elemento de la matriz diagonal} \\ y_{i} &= \left( \text{close}_{t} - \text{vwap}_{(t+s)}\right)^2 \\ x_{i} &= \left[s_i, 1\right],\text{ retraso en el tiempo } s \text{ y constante} \\ \hat{\boldsymbol{\beta}} &= (X^\textsf{T} W X)^{-1} X^\textsf{T} W \mathbf{y} \end{align} $$
Esta respuesta omite open, high, low; y mantiene close, volume, vwap.
Dependiendo del intervalo de tiempo $t$, la acción, y la instalación de ejecución, open puede ser la misma ejecución que close, por lo que también evito usar tanto $open_t$ como $close_t$.
High y low son valores atípicos, y peor aún, potencialmente filtrados o manipulados por las instalaciones de ejecución por razones competitivas o legales. Por lo tanto, los valores reportados de high y low pueden no ser high y low en el entorno irrestricto asumido por los estimadores.
En acciones muy líquidas, el último intercambio de un período ocurre aproximadamente al mismo tiempo que el primer intercambio del siguiente período, por lo que la varianza de evolución entre intercambios adyacentes es aproximadamente cero, y la suma de la varianza de observación para los dos intercambios es aproximadamente: $\textrm{Var}\left(\text{close}_{t-1}-\text{open}_{t}\right) \approx 2 \sigma_{\text{spread}}^2$