18 votos

Selección de variables en los modelos de factores de

Digamos que usted tiene una variable dependiente y muchas variables independientes. ¿Cuáles son los preferidos de las métricas para la clasificación y selección de variables basado en el poder explicativo? Digamos que no tienen que ver con la correlación entre las variables de entrada.

Mis pensamientos están a continuación. Quiero saber si me estoy perdiendo algo obvio, o si hay una métrica que usted siente que domina a los demás.

  1. De correlación de Spearman de controlar para el sector
  2. De causalidad de Granger
  3. Johansen prueba de cointegración
  4. Grinold de la Información de la Relación de
  5. El desempeño económico del factor en un factor de backtest (es decir, la reducción, sharpe, etc.)
  6. La volatilidad del factor de prima
  7. La persistencia del factor de prima
  8. Monótona relación de la prueba
  9. Importancia de la prueba en la propagación de retorno (Q5-Q1) frente a la Media de Retorno
  10. R^2 del factor de la coagulación después de la construcción de algún tipo de modelo

Mi preferencia sería el coeficiente de correlación.

4voto

Brian Sullivan Puntos 6392

Me gustaría añadir:

  1. De reducción de varianza
  2. Fracción mismo signo / tasa de éxito

Además, se puede observar la relación entre el Q5-Q1 extendió y la dependiente (es decir, son más grande/más pequeño diferenciales asociadas con alguna característica de la dependiente).

El volumen de negocios también pueden ser un problema como el deslizamiento y la fricción entran en consideración. Medidas tales como el por ciento de la facturación en el Q5-Q1 de la cartera, y el coeficiente de correlación de caries a través quedado períodos pueden resultar interesantes en la selección de los factores con mayor estabilidad y persistencia.

1voto

Dan Herbert Puntos 38336

1voto

Loren Pechtel Puntos 2212

No creo que ninguna de las actuales respuestas, responder a la pregunta, no es una métrica que domina todos ellos y que es simplemente el t-stat del factor. Esto se muestra claramente a través de la literatura académica como bien.

La regla de aquí es el uso de un t-stat mayor que 2.

0voto

Brendan Puntos 150

Hay un par de otras técnicas a considerar en adición a lo que ya se ha sugerido.

Componentes principales regresión (PCR). Esto consistiría en hacer un PCA en las variables independientes y, a continuación, la regresión de la variable dependiente en los factores. Siempre se puede traducir los coeficientes de nuevo en la base original.

De mínimos Cuadrados parciales (PLS). Muy similar a la PCR, pero mientras que la PCR PCA es acerca de la elección de los coeficientes para maximizar la explaned la varianza de las variables independientes, en PLS elige los coeficientes de modo que las variables independientes explican la mayor parte de la varianza de la variable dependiente.

Criterio De Información. Si puede expresar la elección entre un modelo más sencillo frente a modelos más complejos, la elección óptima bajo este enfoque es elegir la más favorable criterio de información. Más común es la AIC, que incrementa la probabilidad de registro del modelo y una disminución en el número de parámetros. Por supuesto, esto requiere hacer algunas suposiciones acerca de los errores del modelo.

Posterior predictivo de cheques. Simular el modelo de datos. Evaluar si tiene sentido.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X