1 votos

¿Cómo puedo aproximar las barras de dólares a partir de datos de minutos en lugar de datos de ticks?

Influido por el libro Advances in Machine learning de De Prado, me he propuesto construir las barras de dólares (en las que cada barra representa una cantidad determinada de dólares de transacciones en el valor) que él respalda como una estructura de datos superior a las barras convencionales basadas en el tiempo, sobre todo por sus propiedades más estacionarias, iid, y estadísticamente útiles.

Por desgracia, no dispongo de los datos de ticks necesarios para poner en práctica la idea.

Sin embargo, tengo una abundancia de datos de 1 minuto, lo que me hace preguntarme cuál es el método más fiel que podría utilizar para aproximar las verdaderas barras de dólares.

Mi plan es:

  • tomar la media del OHLC de cada barra de minutos,
  • multiplícalo por el volumen de esa barra,
  • asignar ese valor en dólares a la barra,
  • y, a continuación, comenzar a agregar las barras hasta el importe en dólares deseado desde el inicio de la serie temporal original hasta su final.

Me doy cuenta, sin embargo, de que esto podría introducir una cantidad de dólares ligeramente superior o inferior a la prevista para cada barra, dependiendo de esa cantidad de dólares prevista para cada barra. ¿Es este enfoque problemático o indigno, dadas las intenciones de De Prado para la barra de dólares? ¿Hay una forma mejor de hacerlo?

1voto

Simon Puntos 106

El siguiente paquete python, mlfinlab ofrece una aplicación tanto para las barras estándar como para las barras con información. La buena noticia es que no tendrás que implementar las técnicas desde cero y que también funcionarán con marcas de tiempo de minutos.

Respecto a cómo aproximar el VWAP de una barra de minutos:

  1. Tal vez sea mejor tomar la media (punto medio) sólo de la baja y la alta. Si se toma la media de OHLC entonces se añaden suposiciones adicionales sobre la evolución de los precios.

Aplicar barras de dólares a los datos de los minutos puede hacer que los datos sean menos heteroscedásticos y probablemente se vea una vuelta a la normalidad en los rendimientos. Un estudio empírico resultaría útil.

0 votos

Gracias por esto- Voy a tomar su consejo re: el uso de la media de HL en lugar de OHLC. En realidad había empezado a utilizar otras funciones de mlfinlab en mi propia función improvisada de barras de dólares, ya que no veía cómo la función actual de mlfinlab get_dollar_bars() funcionaría con datos de minutos como tú dices (su documentación especifica que los datos importados estén en el formato [date_time, price, volume], lo que parece no funcionar con datos de minutos en forma OHLC. ¿Estás seguro de que los datos por minuto pueden utilizarse con esa función?

0 votos

Además, ¿no sería ventajoso que los datos fueran menos heteroscedásticos, sobre todo teniendo en cuenta otras funciones de mlfinlab, como la de características fraccionalmente diferenciadas, que tratan de hacer que las series de precios sean más estacionarias (aunque sin perder demasiada "memoria")?

0 votos

A1: Así que en el contexto de OHLC crearías un nuevo df que es fecha, cierre, volumen. Tendrías que añadir la suposición de que el último precio en la barra de minutos es el precio "tick", esto viene con la suposición añadida de que el volumen se ejecutó al precio de cierre. (Sí, esto no es ideal, pero usted ya está utilizando un sello de tiempo que no es ideal (minuto OHLC))

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X