Cómo hacer la en la muestra de estimaciones y fuera de la muestra estima que tan a menudo se oye autores se refieren en emperical análisis de VULCANOLÓGICO diferencian?
Respuestas
¿Demasiados anuncios?El término de la muestra y de la muestra son comúnmente utilizados en cualquier tipo de optimización o métodos de ajuste (OMV es sólo un caso particular).
Al realizar la optimización, calcular los parámetros óptimos (generalmente los pesos de la cartera óptima en la asignación de activos) sobre una muestra de datos, por ejemplo, los rendimientos de los títulos de la cartera durante los últimos 5 años.
La cosa es que, si ejecuta su estrategia sobre el conjunto de datos determinado (en los últimos cinco años), que hacerlo en la muestra i.e a evaluar su resultado sobre la muestra que se utiliza para encajar. Esto debería técnicamente dar el mejor resultado posible.
Si se evalúa la estrategia a lo largo de los próximos dos meses, entonces usted va a hacer fuera de ejemplo, yo.e a evaluar en un período que es diferente de la que usted optimizado de la estrategia.
En la asignación de activos, es importante para el uso fuera de la muestra de backtesting, porque usted sólo será capaz de invertir el día de hoy el resultado de una optimización de hecho hoy en día. Por lo tanto, usted va a ganar mañana del rendimiento de la estrategia; no ayer's.
Yo no creo que sean directamente aplicables a los OMV porque inherentemente siempre el modelo de la frontera eficiente de activos o la selección en la muestra de datos y el resultado se mide fuera de la muestra. Usted no puede decir, "hey yo modelo en la muestra sobre los datos de 2005 y, a continuación, medir el rendimiento de la cartera durante el año 2006 los datos y comparar con los resultados derivados de los datos de 2010." 2010 devuelve puede ser derivada de la "más eficiente" de la cartera que puede ser completamente diferente de la "más eficiente" de la cartera que se construyó en 2005.
En realidad, una debilidad inherente de los OMV es que "trata de regreso como una expectativa de futuro y utiliza la volatilidad como una proxy de riesgo, el defecto es que la volatilidad es un histórico parámetro y usted no puede asumir que hoy en día los precios de proporcionar un pronóstico exacto para el futuro". (Media–Varianza De Optimización: A Primer).
Obviamente hay conexión entre la muestra y de los datos de muestra como se indica en la cita anterior, pero como ya he mencionado que no considere la posibilidad de su uso en la misma manera como en la muestra y de los datos simples son utilizados, por ejemplo en los de optimización donde la optimización se realiza una vez, en la muestra, y los resultados son comparables entre los diferentes fuera de la muestra de marcos de tiempo.
En términos prácticos, esto significa que su estrategia se realiza de forma similar a como se mide por decir ratio de Sharpe en la muestra de datos no ha visto antes. Tenga en cuenta que hay un montón de ambigüedad en la frase anterior. Por ejemplo, si usted probado en un conjunto de equidad de datos de 10AM a 3PM, la eliminación de mercado de los cierres y aperturas y ponchó a eventos especiales, se podría pensar que han hecho un buen trabajo de optimización. A continuación, tirar del mercado de aperturas, cierre y eventos especiales de la espalda y su ratio de Sharpe va negativos.
Lo que la mayoría no discutir es cómo dividir el conjunto de datos en en la muestra y fuera de la muestra. Tiendo a pensar que se debe al azar que es el más cercano a la feria. Entonces usted podría usar primer set para la optimización y la segunda para la validación. Mejor aún, durante la optimización de elegir los conjuntos de forma dinámica.