Me gustaría crear estimaciones por separado para el volumen y la elección de instrumento de deuda. Hay herramientas para estimar estos simultáneamente, pero no veo una atractiva ventaja aquí.
Supongo que el volumen está condicionada a la elección de la emisión de deuda así que usted puede comenzar mediante la predicción de la elección de la emisión de deuda y utilizar esto como una entrada para el volumen de modelo. El volumen de modelo tendría una variable ficticia asociado con el tipo de emisión de deuda (necesita k-1 variables ficticias donde " k " es el número de emisión de la deuda de los tipos). Usted puede elegir para asignar las probabilidades a través de cada una de las variables ficticias, o predecir el volumen condicional en el tipo de emisión de deuda.
Para el volumen, hay una amplia variedad de modelos de regresión y maneras de proceder. Voy a ilustrar un enfoque convencional:
1) Desarrollar la hipótesis de que las variables y/o factores de unidad la variable dependiente.
2) Considerar la normalización de las variables (z-scores).
3) Identificar las interacciones entre las variables, en particular las variables de la economía.
4) Agregar variables ficticias para representar los convenios.
5) Realizar la selección de variables si es necesario.
6) Capacitar a un modelo y validar en una bodega de la población a protegerse contra sobre-ajuste.
Tenga en cuenta que hay bastante un par de detalles en el proceso : falta de imputación, identificación de tratamiento, selección de variables, de temporada & ARCO efectos en volumen de comercio, y la forma funcional de la especificación de que están más allá del alcance de este post.
Puede ser preferible que el volumen del modelo para cada tipo de segmento o de la emisión de deuda, por ejemplo, me imagino tesoro de los estados unidos tiene el mayor volumen negociado al alto rendimiento de los mercados de bonos están congelados (vuelo a la seguridad). También, el modelo de la dinámica puede variar según el estado económico de las variables. Si ese es el caso, considere la posibilidad de un régimen de conmutación modelo como un modelo lineal dinámico (para estados continuos) o modelo oculto de markov (para estados discretos).
Para estimar la probabilidad de un determinado instrumento de deuda de un modelo multinomial de trabajo sería el de agrupamiento k-means, CARRITO de clasificación SVM clasificación, o una variedad de otras herramientas. Usted podría tomar una decisión más informada entre estas si había algo de teoría relacionadas con los atributos de las variables dependientes. En ausencia de una teoría, un examen empírico informado por la validez de sus hipótesis podría revelar algunas ideas.
Usted también querrá considerar el costo de los errores de clasificación como evaluar la matriz de confusión de su modelo de clasificación y ajustar este parámetro en el modelo de clasificación.