Estoy intentando evaluar y comparar el factor de beneficio de diferentes "pruebas" de una estrategia de trading en FOREX.
Mi problema es que, a pesar de un tiempo medio entre órdenes de más de 2 horas, algunas de estas ejecuciones pueden tener más de 20 órdenes seguidas, cada 5 minutos, en la misma dirección. Necesito alguna manera de normalizar estos grupos que se producen sin simplemente tirar los datos.
Quiero tratar el cluster como 1 punto de datos promediando la ganancia/pérdida de cada operación dentro del cluster.
Estaba pensando en hacerlo con una ventana de tiempo en movimiento de la siguiente manera:
For each order:
Weight = 1/(N+1)
N = count of consecutive orders within 30 minutes of the current order.
Pero no estoy seguro de que eso sea correcto.