Agregar más variables a un modelo generalmente aumenta su precisión. Sin embargo, sin un análisis adecuado también podría conducir a una curva de ajuste.
Otra pregunta (la cantidad de datos necesarios para validar un corto horizonte de la estrategia de comercio?) recibido respuestas relacionadas con la significación estadística del error estándar de la modelo. Sin embargo, me pregunto si alguien tiene los resultados (o análisis) de lo que debe ser la relación de los datos de la muestra a las dimensiones utilizadas en un modelo. Mi intuición me ha llevado a utilizar, al menos, 30 veces más datos de la muestra de puntos de variables implementado como dimensiones, pero no estoy contento con este enfoque.
Supongo que esto dependerá de las características del modelo (sería diferente para regresiones lineales, SVM, modelos no lineales, etc. y también depende de las relaciones entre las variables utilizadas), pero hay un marco general para la estimación de esto?