Resumen rápido: el modelo todavía debe estar bien especificado, siempre y cuando:
1) hacer el análisis en un comerciada de activos, por ejemplo, de IBM en la BOLSA de nueva york, y
2) el uso de heterocedasticidad coherente con los errores estándar en el marco de estimación, por ejemplo, Blanco estándar de errores.
Yo voy a empezar el tiempo de respuesta por re-afirmando la pregunta para asegurarse de que yo tengo derecho.
Vamos a $v_{t_n}$ denotan cierto grado de volatilidad día $t$ de un retorno que se extiende $[t_0, t_n]$, donde $n$ es también estocástica, y es el momento de la primera operación que realice. Vamos a $c_t$ ser el costo asociado con su primer comercio en el día $t$. A continuación, se desea estimar el modelo:
\begin{ecuación}
c_t = \alpha + \beta v_{t_n} + e_t
\end{ecuación}
donde hacemos la habitual supuestos sobre nuestra residual $e_t$, por ejemplo, $\mathbb{E} e_t | v_{t_n} = 0$, e.t.c. $c_t$ es observable (estoy suponiendo), pero $v_{t_n}$ es, obviamente, no es observable. Así, en lugar de reemplazar $v_{t_n}$ con el estimador de $\hat{v}_{t_n}$, que se dio cuenta de la volatilidad, que se estima el uso de todos los 5 minutos vuelve en el día $t$ por hora $t_0$ a $t_n$, donde estos retornos se construyen a partir de la observación de que todas las transacciones que están disponibles públicamente en el día $t$.
Supongamos (para hacer la vida más fácil) que $t_n$ cae en un múltiplo exacto de $5$ minutos después de $t_0$, y que del mismo modo que son capaces de observar el resto de las transacciones en cada múltiplo exacto de $5$ minutos con el fin de construir su di cuenta vol. Si los supuestos anteriores no se cumplen, es sólo una cuestión de la ampliación de las cosas por la manera apropiada pequeños incrementos de tiempo.
Siempre podemos escribir nuestro estimador de la siguiente manera:
\begin{ecuación}
v_{t_n} = \hat{v}_{t_n} + u_t
\end{ecuación}
es decir, la verdadera vol es igual a di cuenta vol además de una estimación del término de error. Subbing la ecuación en su original de regresión, se obtiene:
\begin{ecuación}
c_t = \alpha + \beta (\hat{v}_{t_n} + u_t) + e_t
\end{ecuación}
o más bien:
\begin{ecuación}
c_t = \alpha + \beta \hat{v}_{t_n} + \epsilon_t
\end{ecuación}
donde $\epsilon_t = \beta u_t + e_t$. Necesitamos por lo menos $\mathbb{E} \epsilon_t | \sombrero{v}_{t_n} = 0$ para estimar el modelo en su forma actual. Me gustaría ser razonablemente dispuestos a hacer de esta suposición fuertemente comercializada de activos. A grandes rasgos, estamos suponiendo que nuestro di cuenta vol error está centrada en el cero y que si toma un valor positivo o negativo en cualquier día dado no está relacionada con la magnitud de los di cuenta vol. Tenga en cuenta que para un poco comercio de activos, esta suposición sería un poco peligroso, ya que podría esperar dado cuenta de vol que presentan un mayor sesgo positivo en los días cuando el verdadero vol es pequeño (desde el vol de la microestructura de ruido será mayor en relación a la verdadera vol). Así que no es nuestra primera restricción: asegúrese de que usted haga el análisis en una base de cotiza, como IBM en la BOLSA de nueva york por ejemplo.
¿Qué otras intuición podemos obtener a partir del modelo? Bien, suponiendo que $cov(e_t, e_s) = 0, t \neq s$ parece razonable, y del mismo modo yo no puedo ver ninguna razón por $cov(u_t, u_s)$ no sería cero, por lo que podemos asumir con seguridad $cov(\epsilon_t, \epsilon_s) = 0$.
Finalmente, llegamos al corazón de la cuestión: definitivamente, esperar que $\mathbb{V} u_t \neq \mathbb{V} u_s, t \neq s$, ya que, como usted señala, algunos se dieron cuenta vols se calcularán a partir de 1 de retorno, y otros pueden utilizar 70 devuelve (no quiero entrar en la relación exacta en demasiado detalle, como el análisis no es necesariamente sencillo estándar se dieron cuenta vol teoría de los usos de relleno asymptotics, pero la situación que tenemos aquí es más similar a la de regular asymptotics, y el verdadero parámetro de interés abarca un intervalo de tiempo distinto en diferentes días...).
Pero creo que no debemos preocuparnos por eso. Todo lo que importa es que se puede estar bastante seguro de que $\mathbb{V} \epsilon_t \neq \mathbb{V} \epsilon_s, t \neq s$. En otras palabras, nuestra regresión se presentan heterocedasticidad. Así que no use OLS. En su lugar, utilice heterocedasticidad coherente de los errores estándar, por ejemplo, Blanco estándar de errores. Cualquier decente software estadístico proporcionará los procedimientos estándar para esto. Tenga en cuenta que usted no necesita preocuparse de conseguir la plena HAC-consistente de los errores estándar, ya que no hay ninguna razón para creer que los residuos se presentan autocorrelación (aunque tal vez la prueba para él sólo para estar seguro).
Nota, por supuesto, sus estimaciones de los parámetros del modelo no va a ser tan bueno porque usted está usando dio cuenta de vol en lugar de la verdadera vol. Realmente no hay nada que usted puede hacer acerca de esto, excepto el uso de tantas observaciones como se puede obtener en sus manos. Sin embargo, su preocupación principal que es la estadística de los efectos del ruido en su RV estimadores ha esperemos que hayan sido tratados por mi análisis anterior.
Otra cosa: Si usted comienza a utilizar su segundo, tercer, y cuarto, e.t.c. el comercio de un determinado día, entonces usted tendrá que volver a este análisis como estoy bastante seguro de que va a introducir algunos no trivial de la dependencia en los residuos de la regresión.
Saludos,
Colin
ps si usted siente que me han contestado a la pregunta, por favor haga clic en la marca de graduación y considerar upvoting (la flecha hacia arriba).