2 votos

La regresión de la TAQ cada media hora de stock volumen de datos en contra de noticias volumen

Estoy planeando ejecutar la regresión de la media hora de stock volumen en contra de la cada media hora noticias de volumen para que las acciones en particular. Estoy buscando a 2 años de datos para mi análisis. Sin embargo, yo estoy pegado a pensar acerca de lo que debe hacerse para la no-horas de negociación en el período de cada día?

Para ser específicos: 1. Debo retroceder los datos sólo para la hora de trabajo de la bolsa, lo que significa que los valores de Y en mi regresión contendrá el stock "volumen" en cada una de 30 minutos a partir de las 9:30-16:00 de cada día de la fecha de inicio hasta la fecha final de mi período de regresión y los valores de X será el correspondiente "noticias de volumen" en cada una de 30 minutos?

O

  1. Qué necesito para hacer que los datos uniformemente espaciados en 30 minutos e incluyen el "no-horas de negociación" para cada día con "ceros", como las bolsas de volumen y el volumen de noticias?

Creo que la regresión resultado será diferente en ambos casos. Necesidad urgente de aconsejar.

2voto

WalterJ89 Puntos 175

No se ejecutan los ceros en contra de los ceros. Esto es similar a cómo los fines de semana son tratados en los estudios académicos. No hay de cinco días con dos días adicionales de 0 en las regresiones para cada semana en la muestra... no es sólo el cinco días (aunque yo le animo a leer sobre el efecto fin de semana).

Su hipótesis es que existe una función de $Volume(t) = f(News(t)) + e(t)$. Cuando el mercado está cerrado, no hay tal función puede existir, entonces ¿qué se supone que la estimación con los ceros de la ecuación de regresión? Si se incluyen los ceros, entonces lo que usted está diciendo a la modelo, que en estos tiempos $Volume(t)=0$ porque $News(t)=0$. Sin embargo, sabemos que esto es falso, y que ambos son cero debido a que $t \in \{Market Close\}$.

Si usted está realmente preocupado por la irregularmente espaciados de series de tiempo, usted podría considerar la posibilidad de un más legítimo de los datos de proceso de generación de:

$$ Volume(t) = f(News(t))*I(t \in \{Market Open\}) + c*I(t \in \{Market Close\}) + e(t)$$

donde $I$ es un indicador de la función. Sin embargo, te darás cuenta de que esto le dará idénticos estimaciones de los parámetros (si $f$ es lineal con una intercepción) como si simplemente calcula la ecuación original durante el horario de negociación única.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X