5 votos

¿Cómo el número de dimensiones de un modelo de afectar a su tamaño requerido de la muestra?

Agregar más variables a un modelo generalmente aumenta su precisión. Sin embargo, sin un análisis adecuado también podría conducir a una curva de ajuste.

Otra pregunta (la cantidad de datos necesarios para validar un corto horizonte de la estrategia de comercio?) recibido respuestas relacionadas con la significación estadística del error estándar de la modelo. Sin embargo, me pregunto si alguien tiene los resultados (o análisis) de lo que debe ser la relación de los datos de la muestra a las dimensiones utilizadas en un modelo. Mi intuición me ha llevado a utilizar, al menos, 30 veces más datos de la muestra de puntos de variables implementado como dimensiones, pero no estoy contento con este enfoque.

Supongo que esto dependerá de las características del modelo (sería diferente para regresiones lineales, SVM, modelos no lineales, etc. y también depende de las relaciones entre las variables utilizadas), pero hay un marco general para la estimación de esto?

3voto

Viktor Haag Puntos 818

La siguiente es una buena manera de juzgar la calidad de los ajusta a un modelo.

http://en.wikipedia.org/wiki/Akaike_information_criterion

3voto

Lie Ryan Puntos 15629

En todos los casos esta es una pregunta muy difícil. Lo más cerca que se llega a un marco general es de Vapnik-Chervonenkis teoría. Usted puede leer acerca de esto en el Capítulo 7.9 de "Los elementos de aprendizaje estadístico" por Hastie, Tibshirani y Friedman, que puede ser descargado desde su sitio web .

Pero se advirtió que este es un enfoque teórico. A menudo más heurística de los enfoques de servirle mejor. El capítulo 7 del libro cubre los así.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X