Recientemente he tenido problemas en entrevistas, para dos puestos de comercio cuantitativo, al dar respuestas poco convincentes a la misma pregunta (bastante básica). Me gustaría entender, desde una perspectiva cuantitativa, lo que me estoy perdiendo acerca de la multicolinealidad.
La pregunta parte del supuesto de que tienes una cartera de activos grande (digamos n=1000 acciones). Si no recuerdo mal, se prepara una matriz de covarianzas (presumiblemente de los rendimientos de los precios). La implicación es que muchos de estos rendimientos están correlacionados. La pregunta es, básicamente, ' ¿cuál es el problema y cómo se soluciona? '.
Sea $X\in \mathbb{R}^{m\times n}$ representan la matriz formada por la concatenación de los vectores de los rendimientos de cada acción observados a lo largo de $m$ tiempos.
- Mi respuesta a "¿Cuál es el problema?":
Si los rendimientos están correlacionados, entonces hay cierta "redundancia" en la matriz $X$ (en el caso extremo, cuando una serie de rendimientos es idéntica a otra, la matriz está subdeterminada). Creo que la implicación es X es nuestra matriz de características, y estamos tratando con un modelo de regresión lineal. De ahí que nos preocupe el impacto de invertir la matriz $X^\top X$ . Si tenemos una multicolinealidad perfecta, no se puede invertir; si sólo tenemos cierta multicolinealidad, el ajuste será deficiente, lo que dará lugar a grandes errores/inestabilidad en nuestras estimaciones de $\beta$ .
- Mi respuesta a "¿Cómo se soluciona?":
Regularización: el modelo tiene "demasiadas" características y debemos dar prioridad a las más informativas. La regularización L1, en particular, nos permite penalizar las soluciones con muchas características y simplificar el modelo (conservando la interpretabilidad), por lo que podríamos utilizar una regresión LASSO en su lugar. También se puede utilizar la regularización L2, pero en general no reduce el número de características.
Por desgracia, no creo que estas respuestas sean de manual, así que me encantaría recibir algunas aclaraciones:
- ¿Se trata siquiera de una pregunta sobre el ajuste de modelos? ¿O se trata realmente de matrices de varianza-covarianza, riesgo de cartera y/o gestión financiera al estilo CAPM?
- Un entrevistador sugirió utilizar el ACP en lugar de la regularización. No estoy seguro de por qué eso sería superior, ya que los componentes principales no se corresponden con las acciones originales que tenía en su cartera).
- ¿Se aplica esto a otros modelos, que no implican invertir $X^\top X$ ¿o sólo regresión lineal?