Tengo un modelo de aprendizaje automático entrenado con una lista de características hipotecarias que incluyen macrovariables donde el campo a predecir (la etiqueta) es "Hipoteca impagada" = 1 o 0 (Sí o No).
Ahora, necesito determinar si una hipoteca va a entrar en mora en el futuro. Para ello, utilizo las mismas características de la macro en la que el modelo devuelve si un pago se realizará o no.
Pero si no se realiza un solo pago, eso no significa que la hipoteca vaya a incumplirse, ya que el prestatario puede retrasar el pago. Además, si las condiciones macroeconómicas mejoran, puedo tener una secuencia de pagos no realizados seguida de una secuencia de pagos realizados.
¿Cuál es la mejor manera de determinar que la hipoteca va a ser impagada? Mi idea es tener un porcentaje de pagos NO realizados, digamos un 10%, y si el número de pagos es mayor que el porcentaje, entonces declarar la hipoteca como impagada. ¿Es válida esta suposición? Cualquier idea adicional será bienvenida.