Actualmente hay un montón de maneras para que la puntuación de crédito. El más popular es el puntaje FICO score, y sus variantes. Para mi tesis de maestría, me gustaría trabajar en hacer mi propio sistema de puntuación de crédito mediante el aprendizaje de máquina. La idea sería obtener algo de la vida real de los datos, y evaluar las puntuaciones de crédito, no necesariamente en el 300-850 gama como en el puntaje FICO score. ¿Cuáles son algunos buenos recursos para entender cómo ir haciendo lo mismo? Cualquier idea se agradece! También, ¿cuáles son algunos de los lugares que podría conseguir de datos libre (o no tan caro de datos) para la construcción de mi modelo?
Respuesta
¿Demasiados anuncios?Un excelente recurso es tratar de Kaggle y examinar algunos de los concursos, algunos de los cuales están específicamente sobre la aplicación de la máquina de aprendizaje a la puntuación de crédito.
https://www.kaggle.com/c/GiveMeSomeCredit
Usted verá que el ganador de la solución se hace público, incluyendo el código fuente y la salida.
https://github.com/IdoZehori/Credit-Score/blob/master/Credit%20score.ipynb
Hay otros problemas además de esto, por lo que debe pasar algún tiempo mirando a su alrededor. Aquí es otro.
https://www.kaggle.com/c/loan-default-prediction
El preferido ML bibliotecas están en R o que cada vez más parece que el de Python Scikit aprender se está convirtiendo en muy popular.
También tenga en cuenta que hay un número de p2p plataformas de préstamo en los estados unidos (y ahora en el reino unido) que proporcionar algunos datos de préstamos para este tipo de análisis. Google Prosperar y Préstamos del Club. Un punto final es que si hay un campo de datos con alta predictivity, el p2p proveedores pueden preferir mantener derechos de propiedad. Como resultado de ello, puede ser difícil encontrar modelos para estos préstamos con buena AUC estadísticas.
La Universidad de Stanford también se ejecuta un ML curso que cubre la puntuación de crédito en el estudiante los proyectos presentados. Mira aquí.
Espero que sea suficiente para empezar.