He desarrollado un modelo que predice los retornos de activos basado en un conjunto de entrenamiento. Soy consciente de que para datos i.i.d., las mejores prácticas sugieren usar validación cruzada de 5 o 10 pasos para equilibrar el intercambio sesgo-varianza. Sin embargo, con datos de series temporales, es crucial mantener el orden temporal, lo que hace que la validación cruzada sea más compleja.
Me he encontrado con varias sugerencias en la literatura y en línea. Un enfoque común es usar una ventana de entrenamiento aumentada con una ventana de validación decreciente. Por ejemplo, en el primer paso, podrías entrenar en periodos 1-48 y validar en 49-60, luego para el segundo paso, entrenar en 1-49 y validar en 50-60, y así sucesivamente.
También hay métodos que utilizan una ventana aumentada, como entrenar en 1-49 y validar en 50, luego entrenar en 1-50 y validar en 51. Además, he visto referencias a la validación cruzada de Monte Carlo y otras técnicas.
No estoy seguro de qué método de validación cruzada sería el mejor para mi análisis. He leído que el primer método que mencioné podría ser especialmente efectivo para datos no estacionarios con quiebres estructurales, lo que es probable en el caso de los retornos de activos. Sin embargo, parece que no hay un consenso teórico sobre el enfoque de validación cruzada óptimo para datos de series temporales no estacionarios. ¿Es eso exacto, o hay un método recomendado para mi situación?
¡Gracias por sus perspectivas!