Primer post, espero estar explicando las cosas con suficiente claridad. Quiero tomar un universo de instrumentos potenciales y negociables y asignarlos a gestores de carteras. Tradicionalmente, esto se hace utilizando una clasificación sectorial, como el GICS. Cuando los gestores de carteras presentaron sus propios universos propuestos, obviamente tenían sus propias clasificaciones sectoriales que diferían de la GICS, lo que me hizo pensar: 1. ¿Es GICS la mejor manera de organizar las cosas (que siempre he llegado a la conclusión de que no es ideal pero es mejor que todos los demás métodos)? 2. ¿Existe una forma estadística de tomar todos los instrumentos dentro de nuestro universo y hacer un análisis de cluster y hacer un dendrograma y luego comparar la agrupación tanto con GICS como con los subconjuntos elegidos personalmente por el PM? Esto también ayudaría a los casos de superposición de los subconjuntos elegidos, ya que ayudaría a tomar la decisión de quién debe obtener los instrumentos superpuestos. 3. He creado una matriz de correlaciones y la he convertido en distancias mediante d^2 = 2(1-|r|). Las distancias euclidianas son comparables para el cálculo de cada nodo, pero parece que cada nodo posterior necesita una nueva matriz y nuevas distancias, ya que la combinación de un nodo anterior representa una fila/columna adicional para añadir a la matriz original. Ya que las distancias no son aditivas debido a la falta de ortogonalidad.
Cualquier idea y sugerencia de código para hacer algo en python sería muy apreciada.