Nunca hay suficientes datos de mercado para las pruebas. Y el muestreo a partir de la distribución definida por el usuario es un tema muy debatido, ya que ¿qué distribución sigue realmente el mercado?
Hay muchas formas de generar series de datos sintéticos para las pruebas de sensibilidad, pero los métodos deben ser sólidos. ¿Merece la pena investigar el siguiente método? Extraiga los rendimientos diarios de n instrumentos diferentes. Mézclelos y emparéjelos a partir de un muestreo con reemplazo. Después de cada nueva serie, mézclelas de nuevo antes de generar otra. Para evitar grandes diferencias en las características subyacentes, el conjunto de rendimientos debería proceder de una clase de activos. Por ejemplo, los datos sintéticos de las acciones deben proceder del conjunto de acciones.
¿Tiene esto sentido? ¿O es demasiado ingenuo?
Gracias,