50 votos

¿Cuántos datos se necesitan para validar una estrategia de negociación de corto plazo?

Supongamos que se tiene una idea para una estrategia de negociación de horizonte corto, que definiremos como la que tiene un periodo medio de mantenimiento inferior a 1 semana y una latencia requerida entre el cálculo de la señal y la ejecución inferior a 1 minuto. Esta categoría incluye mucho más que las estrategias de creación de mercado de alta frecuencia. También incluye el arbitraje estadístico, la negociación basada en las noticias, la negociación de los beneficios o de las publicaciones económicas, el arbitraje entre mercados, la inversión/momento a corto plazo, etc. Antes de pensar en operar con una estrategia de este tipo, es obvio que habría que hacer una prueba retrospectiva con una muestra de datos suficientemente larga.

¿Cuántos datos hay que obtener para estar seguros de que la estrategia "funciona" y no es una casualidad estadística? No me refiero a la confianza suficiente para apostar el rancho, sino a la confianza suficiente para asignar recursos adicionales significativos a las pruebas de avance o a la negociación de una cantidad relativamente pequeña de capital.

La adquisición de datos (y no sólo de precios de mercado) podría ser muy cara o imposible para algunas señales, como las basadas en series temporales económicas o financieras más recientes. Por ello, esta cuestión es importante tanto para decidir qué estrategias investigar como para saber cuánto invertir en la adquisición de datos.

Una respuesta completa debería depender del Ratio de Información esperado de la estrategia, ya que una estrategia con un IR bajo necesitaría una muestra mucho más larga para distinguirla del ruido.

50voto

Greg Hurlman Puntos 10944

Considere la error estándar y, en particular, la distancia entre los límites superior e inferior:

\begin{equation} \Delta = (\bar{x} + SE \cdot \alpha) - (\bar{x} - SE \cdot \alpha) = 2 \cdot SE \cdot \alpha \end{equation}

Utilizando la fórmula del error estándar, podemos resolver el tamaño de la muestra:

\begin{equation} n = \left(\frac{2 \cdot s \cdot \alpha}{\Delta}\right)^{2} \end{equation}

donde $s$ es la desviación estándar medida, que ya tiene de su cálculo de IR.


Ejemplo de alta frecuencia

Hace poco estuve probando un modelo de creación de mercado que se esperaba que devolviera un par de puntos básicos por cada comercio y quería estar seguro de que mis rendimientos eran realmente positivos (es decir, no una casualidad). Así que elegí una distancia de 3 puntos básicos $(\Delta = .0003)$ . La desviación estándar medida de mi muestra fue de 45 bps $(s = .0045)$ . Para un intervalo de confianza del 95% $(\alpha = 1.96)$ mi tamaño de la muestra tiene que ser $n = 3458$ oficios . Habría elegido una distancia más ajustada si hubiera estado simulando este modelo, pero estaba operando en vivo y no podía ser demasiado exigente con el dinero en juego.


Ejemplo de baja frecuencia

Me imagino que para un modelo de baja frecuencia que se esperaba que devolviera el 1,5% por mes yo querría tal vez un 1% como distancia $(\Delta = .01)$ . Si el ratio de Sharpe esperado fuera 3, entonces la desviación estándar sería del 1,7%. $(s = .017)$ que se me ocurrió al retirar la cantidad mensual de de los rendimientos mensuales. Así que para un intervalo de confianza del 95% $(\alpha = 1.96)$ Necesitaría 45 meses de datos.

0 votos

0 votos

Buena respuesta. ¿Puede publicar la transcripción del chat aquí también para completarlo? Me sale un error de página no encontrada en el enlace anterior.

0 votos

@SumindaSirinathSalpitikorala Recibo un "Esta habitación ha sido borrado automático por inactividad error". De todos modos, no hay nada para "completar"; Tal y yo tuvimos un ida y vuelta sobre los ejemplos que finalmente se convirtieron en la respuesta que ves ahora. Siéntase libre de mirar el historial de ediciones para ver lo diferente que era mi primer borrador.

4voto

public static Puntos 3587

También me gustaría señalar que hay que tener cuidado con las correlaciones entre los puntos de datos. (Por ejemplo, si tienes un punto de datos que demuestra que esto funciona para la compañía petrolera x. Otro punto de datos para la compañía petrolera y puede que no cuente como algo separado).

Si está buscando periodos de tenencia de 5 días, por qué no coger todos los datos EOD que pueda también.Los datos EOD obviamente no son negociables pero pueden ser usados como una comprobación de cordura para los retornos de las estrategias de trading a largo plazo cuando no se tienen realmente los datos.

0 votos

Hola Michael RB, bienvenido a quant.SE y gracias por aportar una respuesta. ¿Tienes alguna idea de cómo la correlación reduce la confianza? En cuanto a los datos EOD, por supuesto que se utilizarán según convenga, pero la cuestión aquí es cuántos datos intradía necesito para una estrategia teórica.

0 votos

Sinceramente, era sólo un ejemplo. para la renta variable, es posible que desee eliminar los rendimientos del sector/del mercado. etc.

4voto

NYSystemsAnalyst Puntos 959

Sorprendentemente, nadie mencionó la necesidad de garantizar que la estrategia de negociación pueda sobrevivir a diferentes tipos de condiciones de mercado. Supongamos que usted utiliza la fórmula de @chrisaycock y llegó a 5000 operaciones. Bueno, usted podría hacer 5000 oficios en unas pocas horas o un 1-2 meses con los criterios originales. Dejando a un lado la cantidad de datos para probar, podría suceder que el período de tiempo que ha seleccionado para probar y recoger 5000 oficios valor de los datos "ajuste" su estrategia bien. ¿Qué pasa con el comercio 5001a o 6000a comercio? Yo me preguntaría cómo habría manejado usted un ' flash crash ¿' o un cambio repentino en el valor del producto? A informe del regulador que se ha suspendido o revocado, con efecto inmediato, una licencia clave necesaria para el funcionamiento legal de la función principal de la empresa?

Una respuesta más precisa en mi opinión y experiencia es asegurarse de que muestrear suficientes datos de ticks para cubrir una variedad de condiciones de mercado . Preste mucha atención a la volatilidad que rodea a los acontecimientos repentinos, así como a los anuncios del calendario económico (principalmente los movimientos bruscos de los precios). El algo necesitaría saber cómo ajustarse para manejar estos movimientos. Por lo tanto, podría ejecutarlo inicialmente sobre un par de años de datos de ticks y observar estos movimientos bruscos y los diferentes tipos de volatilidad. Luego, en las siguientes ejecuciones, puede centrarse en los movimientos bruscos en primer lugar, y luego reproducir los datos restantes para validar aún más la estrategia.

0voto

Juddling Puntos 205

Para validar de forma exhaustiva una estrategia de horizonte corto se necesita lo siguiente

  • Datos
  • Longitud: La cantidad de datos debe ser tal que cubra diferentes escenarios de mercado. Algunos escenarios de mercado comunes son la flexibilización cuantitativa, las rabietas, la burbuja de las punto com, la crisis monetaria asiática, etc. Por lo tanto, cuantos más sean, mejor. Sin embargo, algunos expertos tienen una opinión diferente en la que dicen que los datos recientes tienen más importancia y que las pruebas con datos de los últimos 2 años deberían ser suficientes. Pero yo prefiero una mayor cantidad de datos para sentirme cómodo.
  • Anchura: Preferiblemente, la estrategia debe ser probada en una amplia variedad de valores y mercados. Si su estrategia no es específica para un valor o mercado en particular, las posibilidades de que la estrategia funcione durante un período de tiempo más largo son mayores. Y de ahí la necesidad de estos pasos. Por lo general, usted puede ejecutar su estrategia en acciones con diferente capitalización de mercado, perfil de volatilidad, ETFs, divisas, materias primas y así sucesivamente.

Es muy difícil encontrar una estrategia que funcione todo el tiempo, pero después de hacer este análisis, tendrá claro en qué condiciones del mercado y en qué instrumentos funciona.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X