1 votos

Muestreo de barras de dólar para modelo de ML de múltiples tickers

Tengo un modelo de Red Neuronal que proporciona predicciones para los rendimientos futuros de una cartera compuesta por acciones y criptomonedas. El modelo original opera en barras temporales estándar y genera predicciones diarias en un momento específico, utilizando datos procesados de velas OHLC (Open, High, Low, Close) como entrada.

Mi pregunta es general y los detalles del modelo no son importantes. Lo más importante es que las características se calculan a partir de las barras temporales. Por ejemplo, el conjunto de datos de entrada puede ser las velas intradía de 5 minutos para cada instrumento, donde se realiza algún procesamiento en los valores de las velas.

Me gustaría ampliar este modelo de Red Neuronal para hacerlo funcionar con barras de dólar, en lugar de barras de tiempo. Las primeras preguntas que me vienen a la mente son

  • El modelo original depende del tiempo, emitiendo predicciones diariamente en momentos específicos. Al pasar a barras de dólar, se pierde esta sensibilidad al tiempo. ¿Cómo podemos establecer criterios para determinar cuándo el modelo debe hacer predicciones? Para un modelo de un solo instrumento, un enfoque posible podría implicar evaluar el conteo diario promedio de barras de dólar dentro de un tamaño de muestra dado y hacer predicciones en consecuencia. Sin embargo, al tratar con un modelo de varios instrumentos, ¿cómo podemos adaptar este criterio?
  • ¿Cuáles son las características más prominentes que se pueden derivar de las barras de dólar y son adecuadas para servir como entradas a una red neuronal? En el ejemplo anterior, el conjunto de datos de entrada consiste en un marco de datos que contiene velas intradía de 5 minutos. Podemos anticipar de manera confiable que habrá una vela a las 10:00 a.m. para cualquier instrumento todos los días. En consecuencia, al elegir esta vela como característica, nos aseguramos de que el conjunto de datos de entrada contenga consistentemente información sobre la vela de las 10:00 a.m. Sin embargo, al tratar con barras de dólar, no hay garantía de que dos instrumentos compartan la misma barra de dólar. Entonces, parece haber una ambigüedad en cómo puedo definir de manera unívoca las características de entrada para un modelo de Red Neuronal.

¿Sugerencias? ¿Perspicacias?

0voto

Randy Hartmen Puntos 38
  • Para q1, tal vez calcular el volumen acumulado por día y seleccionar n umbrales en los que predecir, como min(cumsum(volumen de a1), cumsum(volumen de a2)) en [1M$, 2M$, ...]
  • Para q2, en lugar de "10am" podrías usar "volumen=1M$"

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X