Como comerciante aficionado, tengo un éxito razonable con mis actuales sistemas de comercio al final del día.
Todos mis sistemas se basan en al menos UN año de datos "dentro de la muestra" para el backtesting, seguido de 6 meses de datos "fuera de la muestra".
Así que mi pregunta es: ¿podría tomar DOS años de datos "dentro de la muestra", pero ignorar cualquier dato de los períodos en los que no hubiera operado debido a las condiciones del mercado?
(He utilizado la etiqueta "datos" y he buscado hasta noviembre de 2011. He buscado en todos los posts "Datos históricos".No he podido encontrar ningún post relacionado).
Ejemplo: Supongamos que quiero operar con un sistema de "sólo largo", en un mercado de "tendencia alcista".
Supongamos que el gráfico de los dos años anteriores se parece a una "W". Los primeros 6 meses tienden a la baja, luego 6 meses al alza, luego a la baja, luego al alza.
¿Puedo simplemente ignorar el primer y el tercer periodo de 6 meses, y utilizar sólo el segundo y el cuarto periodo de 6 meses?
Razón: Si el mercado tuviera una tendencia a la baja, no operaría. Entonces, ¿por qué mi sistema debería basarse en cualquier dato anterior del mercado que estuviera en tendencia a la baja?
Método:
- En el ejemplo "W" anterior, copie y pegue los datos del segundo semestre en Excel.
- Ignora los datos del tercer semestre.
- Copie y pegue los datos del cuarto semestre en Excel.
- Pero ajusta todo el segundo lote de datos hacia arriba para que se una sin problemas al final del primer lote. (Posiblemente haciendo que el primer precio del segundo lote sea igual al último precio del primer lote).
- Así, el resultado sería una serie de datos de un año que sólo tendrían una tendencia al alza.
Estaría muy agradecido por cualquier comentario.
(Añadido después de la respuesta de Nathan S más abajo. Mi añadido es demasiado largo para añadirlo como comentario a la respuesta de Nathan S).
Para mí todo depende de si su sistema puede clasificar una serie de precios como "de tendencia alcista".
Mi primera impresión fue que se trata de un punto válido. Así que estaba a punto de defender mi indicador de tendencia (TE). Pero, pensándolo bien, ahora creo que es una distracción. Se me ocurre que personas como los ingenieros, los solucionadores de problemas informáticos y las personas que realizan ensayos con humanos siempre intentan aislar el "factor o factores comunes" entre dos conjuntos de experimentos. Después de eso, cualquier diferencia entre los resultados de los experimentos dependerá únicamente de las diferencias entre los componentes.
En mi caso, creo que el TE (bueno o malo) es un factor común. Ya se ha optimizado en una lista de vigilancia utilizando 3 años de datos de mercado "no adulterados". Utilizo ese TE para cualquier sistema basado en esa watchlist. (Para otras watchlists, tengo diferentes TEs).
Así que el TE será común a ambos conjuntos de experimentos (datos adulterados frente a datos no adulterados). En el caso de los datos adulterados, es obvio que tengo que extender el punto de partida más atrás en el tiempo para capturar el número necesario de barras (días) de datos adulterados.
He aquí algunas afirmaciones que he visto sobre la "selección" o "cherrypicking" de datos para el backtesting. Lamentablemente, no tengo enlaces, porque suelo estar de acuerdo con todas estas declaraciones. (Es más probable que guarde los enlaces de las declaraciones con las que no estoy de acuerdo, para una investigación posterior).
No dé por sentado que un sistema que funciona con uno de los siguientes funcionará con el otro:
- Acciones estadounidenses frente a acciones australianas.
- Una cartera de productos financieros frente a una cartera de servicios públicos.
- Un mercado alcista frente a un mercado bajista.
Creo que fue la última afirmación la que me hizo "inventar" mi propia afirmación: No optimices un sistema de "tendencia alcista" utilizando datos de tendencia bajista.