4 votos

Sistema experto para la Puntuación de Crédito

Estoy trabajando en un modelo de puntuación de crédito para un crédito sin garanty (crédito de consumo).

Estoy buscando una metodología para un sistema experto para la puntuación de crédito de decisión que no se base en métodos estadísticos. He intentado varios métodos estadísticos en mis datos (regresión logística, en el bosque aleatorio) - sin éxito. Mis variables no son predictivos suficiente y las predicciones son demasiado pobres para construir un cuadro de mandos.

Estoy modelando una variable binaria con los niveles 0 y 1, donde 1 es el valor predeterminado, y tengo varias variables predictoras.

Ahora estoy en busca de un método que combina la información de los datos con un sistema experto (el conocimiento humano)? ¿Qué puedo hacer?

Hace un método o algoritmo como este existe? ¿Qué acerca de Apriori?

6voto

RedFilter Puntos 333

El modelo más utilizado por los profesionales para el modelo de crédito de consumo es el modelo de regresión logística; ahora, dijo que se trató de la modelización mediante el modelo logístico sin éxito, pero quiero intentar sugerir el paso a paso el procedimiento que me gustaría utilizar en este caso.

El modelo de crédito al consumo, me gustaría seguir el siguiente procedimiento:

  • El Análisis De Las Muestras:

I analizar la distribución de la muestra, verificando que tiene aproximadamente la misma distribución de la población o punto de referencia. El tamaño de la muestra debe ser adecuado (al menos 50k observaciones sobre al menos 5/7 años de observaciones, de acuerdo a lo sugerido por el acuerdo de Basilea).

En tales pasos, usted puede realizar este tipo de análisis mediante el uso de la Población Índice de Estabilidad, dado que, para cada variable, por:

$PSI$ $=$ $\sum\limits_{i=1}^n (P_{i,1}-P_{i,2})*ln\frac{P_{i,1}}{P_{i,2}}$

donde $P_{i,1}$ es el porcentaje de observaciones en la clase j de la población de referencia se considera y $P_{i,2}$ es el porcentaje de observaciones en la clase j de la muestra.

Calcular el PSI para cada variable en la muestra, mediante la comprobación de que el PSI es menos de 10%; el umbral es empírica y depende del país/instrumento que está analizando.

Eliminar de la muestra variables que no son estables sobre la base de la PSI.

  • La Calidad De Los Datos El Análisis De:

analizar los valores de la muestra de la indicación del porcentaje de valores perdidos, las anomalías en los valores (como, por ejemplo, el valor 999.999) y valores de error de acuerdo con el sentido económico (como, por ejemplo, valores negativos para las variables que deben ser necesariamente positivo, como el valor del préstamo). Me gustaría eliminar todas las variables con desaparecid @ s, anomalías o valores de error con un porcentaje mayor al 5%.

  • Análisis De Regresión Logística

Implementar una logística en la regresión de la variable objetivo en los independientes, al eliminar las variables que no son significativos al 5% de nivel; eliminar las variables con correlación mayor de 30% (de nuevo, esto es una regla empírica, así, el uso de que como regla de pulgares y no como punto del umbral). Después de eso, ejecutar un paso a paso de selección de variables del modelo, manteniendo las variables significativas sólo.

Ahora, esta es la básica paso a paso el procedimiento que me gustaría utilizar para el modelo de mercado de crédito al consumo. Siguiendo a uno, usted debe obtener un AUROC aproximadamente igual a 80% (70% en la prueba de validación/set). Si no lo es, se podría calibrar/ajustar su modelo mediante la introducción de experto/recriminatoria variables. Esto significa pedir a sus colegas para definir qué variables, según ellos, influye en la probabilidad de incumplimiento y ajustar el peso de las variables en el modelo de la nivelación de ellos; esta es la manera más sencilla. En segundo lugar, se podría desarrollar un modelo paralelo construido en juicios de valor de manera totalmente (por ejemplo, hacer un cuestionario acerca de las variables que podrían afectar a la DP y preguntar a varios profesionales para compilar y, finalmente, tomar las más importantes variables.

Si no eres un profesional, las siguientes son las más comunes de las variables que afectan el EP:

  • Préstamo/Crédito cantidad;
  • La deuda de la relación Ingreso -;
  • Edad;
  • De trabajo;
  • Salario/sueldo cantidad;
  • Buró de crédito puntuación de crédito;
  • Pasado de los consumidores hacen la historia (si el cliente compra algo en el pasado y no era ser capaces de pagar o no la deuda);

y así sucesivamente... por Desgracia, no existe un algoritmo para desarrollar experto basado en el riesgo de crédito de modelo. De hecho, el experto de la juez se basa en la experiencia del banco cajero/administrador y tal experiencia cambia según el país en el cual el empleador. El mercado de créditos de consumo a cambios de acuerdo a un montón de cosas, tales como el país de la cultura, las normas, la ley, la forma en que los Bancos Centrales se aplica el acuerdo de Basilea, y así sucesivamente. No es posible adaptar un modelo a construir a realizar en el reino unido a un país de américa latina que, como España, Italia, etc

Espero que esto ayude.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X