1 votos

Buscando opciones para visualizar grandes datos de series temporales de mercado

Tengo un gran conjunto de datos que incluye los datos de ejecución de mi estrategia. Las columnas del conjunto de datos incluyen la fecha de la vela, el precio de cierre y muchos datos relacionados con la estrategia.

He construido una visualización Mathplotlib para mis datos de ejecución de backtest. Aunque mi visualización funciona, trabajar con los gráficos de Mathplotlib es tedioso. Me gusta tener algo como los deslizadores de rango de Plotly.py que se muestran aquí https://plotly.com/python/range-slider/

Antes de gastar tiempo y migrar mi visualización a otra plataforma, quería preguntar cuáles son las opciones eficientes y productivas para visualizar grandes series temporales de datos de mercado. Hasta ahora se me han ocurrido las siguientes opciones, pero espero saber si me falta alguna herramienta o librería común:

  • Gráficos ligeros de Tradingview - Fuente abierta: No estoy seguro de que pueda manejar grandes bases de datos
  • Plotly.py : No estoy seguro de que pueda manejar grandes datos
  • Power BI

¿Me falta alguna herramienta, biblioteca u opción mejor?

2voto

Diondon Puntos 1

He podido soportar algunas aplicaciones de demostración con más de 3 millones de puntos de datos en resolución de microsegundos en Highcharts, basadas en este ejemplo .

0voto

Avias Puntos 71

Sé que en mi empresa algunos de los operadores de algo están utilizando Panóptico de Altair para visualizar los datos de negociación en tiempo real cuando se conecta a un sistema de base de datos KDB. No estoy seguro de que tengan una versión gratuita.

0voto

BC. Puntos 9229

Si te gusta Plotly, Julia's puede producir gráficos como este . Tiene el rangeslider, puedes hacer paneo, box select, lasso select, todo sin añadir mucho código. Así es como se ve en un cuaderno Jupyter:

enter image description here

No estoy seguro de que sea de interés si no estás familiarizado con Julia, pero el lenguaje tiene algunos buenos puntos de venta. El más notable es la velocidad. También es de código abierto.

Hice una comparación de velocidad aquí que destaca las diferencias con Python. Ya que has preguntado por los datos grandes, Quantinsti tiene algunas buenas pruebas para operaciones múltiples en grandes conjuntos de datos. Por ejemplo, para 100 grupos de ~10.000.000 filas, Python (paquete pandas) y R (paquete dplyr) dieron un error interno y un error de memoria, respectivamente, mientras que Julia tardó 2,4 segundos la primera vez y 1,8 segundos la segunda.

También es un lenguaje muy bien diseñado que permite tratar rápidamente los problemas de desbordamiento y de matemáticas en coma flotante, como se puede ver aquí .

Hay otros paquetes como Vegalite que también son muy útiles.

Por último, pero no menos importante, tiene Plots.jl con Series de tiempo.jl que es muy flexible en sí mismo. Plots le permite cambiar rápidamente entre backends como PlotlyJs, GR,... sin siquiera cambiar el código.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X