En su libro - los Avances en la Financiera de Aprendizaje de Máquina, Marcos López de Prado familiariza al lector con un número de maneras de normalizar nuestras financiera de datos de series de tiempo. A continuación presento un par de ejemplos (fuente: aquí) para el propósito de esta pregunta:
- Tiempo de Barras: las Barras de indexado por intervalos de tiempo, minuciosamente, diario, etc. OHLCV (Open, High, Low, Cierre, Volumen) es estándar.
- La garrapata de Barras: las Barras de indexado por los pedidos, con cada conjunto # de pedidos (normalmente 1) la creación de un distintivo de la barra. Precio de la orden, el tamaño y la intercambio de la orden se ha ejecutado en son comunes.
- Volumen de Barras: las Barras de indexado por el volumen total, con cada conjunto # de acciones negocian la creación de un distintivo de la barra. Podemos transformar minutos de bares en un aproximación para barras de volumen, pero lo ideal sería utilizar la garrapata de barras para mantener la información de todos los parámetros a través de las rejas.
- Dólar de Barras: Similar a las barras de volumen, a excepción de la medición de la total valor en DÓLARES que se negocian las manos. Un ejemplo podría ser de $100,000 bares, con cada barra contiene tan precisamente como sea posible, que el valor del dólar.
Cuando el tiempo de transformación barras de registro de returs para barras de volumen o el dólar de los bares, la serie está mucho más cerca de nomrally distribuido.
Otra forma estándar de la normalización de tiempo de la serie sería:
- La volatilidad de normalizar por la seguridad
- Menospreciar la serie de tiempo
Mi pregunta es: ¿hay una diferencia significativa entre la normalización de Volumen o el Dólar de los bares vs Vol normalizar y rebajar?