2 votos

Estrategias de backtesting - Tipos de muestreo y rendimientos

Estoy probando una estrategia en R y tengo algunas preguntas sobre el diseño de las pruebas. Tengo un universo de alrededor de 500 acciones para probar filtradas en base a la liquidez. Para probar la estrategia de trading he implementado un simple esquema de pruebas dentro y fuera de la muestra. Antes de ejecutar una prueba completa en todo el universo de acciones he estado ejecutando las pruebas sobre una muestra aleatoria de las acciones, mientras que el diseño de un marco de pruebas genéricas.

He estado dividiendo el universo en dos partes, he estado optimizando sobre una muestra aleatoria de diferentes acciones y luego usando los parámetros optimizados del conjunto de entrenamiento para probar sobre una selección aleatoria de diferentes acciones del conjunto de prueba. ¿Hay algún problema en hacer esto en lugar de probar el universo total?

Mi otra pregunta tiene que ver con el uso de los precios frente a los rendimientos (frente a los rendimientos logarítmicos). Estoy un poco confundido en cuanto al razonamiento para utilizar los rendimientos en lugar de los precios para encontrar señales. ¿Utilizaría usted las series de rendimientos porque es más fácil comparar las series de rendimientos que las de precios?

0voto

mechler Puntos 16

Creo que el muestreo aleatorio tiene algunas ventajas definitivas. En primer lugar, reduce el riesgo de "sobreajuste" al optimizar los parámetros de la estrategia para una determinada muestra de activos. En segundo lugar, con un universo de activos tan grande, obviamente tomaría toneladas de tiempo y recursos computacionales para probar una estrategia sobre los datos históricos de cualquier longitud significativa, por lo que tipo de evitar "castigar" a sí mismo para el uso de un largo marco de tiempo histórico para probar en.

Dicho esto, si su objetivo final es operar en vivo la estrategia en los 500 activos específicamente, tal vez usted pierde algo por sólo la optimización de una muestra aleatoria de los activos. Hay un poco de pensamiento crítico involucrado aquí en cuanto a lo grande que la muestra aleatoria debe ser, lo grande que el espacio de parámetros, y así sucesivamente. Así que al menos parte de la respuesta dependerá de sus objetivos finales.

En cuanto a la utilización de los precios frente a las señales, en mi opinión la utilización de los rendimientos puede ser realmente peligroso. ¿Por qué? Cuando se negocia, las operaciones se realizan a un precio determinado, no a una rentabilidad determinada (al menos en lo que respecta a la contabilidad). La otra cosa que vale la pena tener en cuenta es que un rendimiento depende de:

(a) Qué tipo de rendimiento (simple, geométrico, logarítmico, etc.)

(b) Cuándo se inicia el cálculo (rendimiento de 1 año, rendimiento de 1 día, etc.)

A menos que la estrategia dependa del cálculo de los rendimientos, yo preferiría utilizar los datos de los precios. (Dado que la eficiencia computacional parece preocuparle dado su gran conjunto de datos, esto también tiene la ventaja añadida de requerir marginalmente menos cálculos, ya que no tiene que calcular los rendimientos para obtener sus señales).

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X