16 votos

¿Qué base de datos de series temporales se puede utilizar con Python y Pandas?

Estoy buscando una base de datos de series temporales que se pueda utilizar fácilmente con objetos de Python y Pandas como DataFrame, Panel...

Pero estos objetos siempre contienen series temporales.

Lo ideal es que busque una base de datos de código abierto.

Quiero que esta TSDB sea capaz de gestionar los datos de los ticks.

2 millones de filas deben ser procesadas (almacenadas y recuperadas) en menos de 30 segundos.

¿Qué sugieres? ¿Cuáles son los pros y los contras de cada uno?

9voto

morechilli Puntos 4889

OpenTSDB es bueno para el almacenamiento de series temporales a gran escala. metrilyx/opentsdb-pandas y wiktorski/opentsdb_pandas parece proporcionar la interfaz con pandas. Prueba de rendimiento en bruto de OpenTSDB y HBase | MoreDevs proporciona un punto de referencia, puede que no se ajuste exactamente a sus necesidades, pero puede intentarlo.

2voto

Existe un sistema de gestión de datos de la serie temporal ( InfiniFlux ) que puede utilizarse fácilmente con Python.

La base de datos no es de código abierto, pero también ofrece una versión gratuita para su evaluación. Así que puedes probar si el DBMS es adecuado para tu proyecto.

Usted pide que se procesen 2M de filas en menos de 30 segundos, InfiniFlux puede almacenar y recuperar más de 500.000 datos en un segundo. Además, ofrece una interfaz y un SQL estándar.

0 votos

Tenga en cuenta que el cartel está asociado al producto.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X