Estoy trabajando en un problema de clasificación binaria equilibrada en un conjunto de datos de series temporales (financieras). Estoy utilizando la validación cruzada K-fold adaptada a las series temporales (de modo que nunca estoy utilizando datos futuros para predecir datos pasados).
He probado muchos algoritmos, como SVM, RandomForest y K-Nearest Neighbors. Aunque todos ellos pueden obtener buenos resultados en la validación cruzada, NINGUNO de ellos ha generalizado bien al conjunto de pruebas.
Utilizo la validación cruzada para ejecutar la selección de características de la búsqueda de la cuadrícula y el ajuste de los hiperparámetros simultáneamente para encontrar la mejor combinación, pero de nuevo - no he logrado ninguna generalización.
¿Tiene alguna idea de por qué puede ser esto? ¿Algún consejo general para afrontar este tipo de situaciones?