Sé que este es un viejo post, pero ya la encontré y sé que la respuesta bien podría compartirlo.
Yo iría más lejos que la primera componente, pero también depende de la cantidad de la varianza en realidad es explicada dentro del componente. Hay dos enfoques que yo uso al determinar que los componentes que estoy utilizando.
- La regla de oro es para el uso de componentes y con un eigen valor mayor que uno.
- Mantenga un ojo en el acumulado de la varianza, por ejemplo yo tengo un conjunto de datos de 150 macro indicadores y los primeros diez puede explicar el 96% de la varianza para un problema en particular, estaba tratando de previsión, si extiendo los componentes a 20 explica que el 96,7% de la varianza. Es la diez factores adicionales realmente relevante? En este caso yo me quedaría con los primeros 10, pero de nuevo, todo depende de su análisis individual.
Para responder a su segunda pregunta, sí..
La PCA es un proceso comúnmente utilizados en el Factor de la Inversión, o smart beta.. Google Smart beta y ver cómo muchas empresas se están acercando a él. Tan lejos como el estrecho de la economía, la respuesta está sí. He visto muchos documentos de trabajo publicados por la reserva federal de que las referencias de la PCA. Ciertamente no hace daño a incluir otros métodos para reducir la alta dimensional de datos. Generalizada impulsado modelos viene a la mente, utiliza un árbol basado en el enfoque. Otro sería el mínimo de redundancia máxima relevancia modelo. Probablemente, el mejor método sería una combinación de los modelos utilizando diferentes de aprendizaje de la máquina y el conjunto de modelado.
De cualquier manera, espero que esto ayude, incluso si estoy respondiendo a la pregunta 3 años después de que fuera publicado. Buena suerte la solución de los problemas mundiales con la econometría.
Saludos,
Aaron