1 votos

Valor máximo del modelo de scoring IV

Estoy haciendo un modelo de scoring crediticio y me sale que una variable tiene un valor de información (IV) superior a 1, ¿es posible?

Fórmulas son bastante simples para el peso de la evidencia (WoE) y el valor de la información (IV)

$$WoE_i = \log \left( \dfrac{\dfrac{g_i}{g}}{\dfrac{b_i}{b}} \right)$$ donde $g_i$ representa el número de productos (no por defecto) en la categoría $i$ de la variable $x_i$ , $b_i$ representa el número de malas (por defecto) en la categoría $i$ de la variable $x_i$ , $g$ representa el número de bienes (no por defecto) en todo el conjunto de datos, $b$ representa el número de malas (por defecto) en todo el conjunto de datos, $N(x)$ es el número de niveles de la variable $x$ es decir, el número de categorías $$IV = \sum_{i=1}^{N(x)}\left( \dfrac{g_i}{g} - \dfrac{b_i}{b} \right) \cdot WoE_i$$

Además, ¿qué es un ajuste perfecto en el modelo?

Por el ajuste perfecto entiendo que sólo hay dos categorías en x: la primera incluye todos los bienes y la segunda incluye todos los males. En ese caso, al calcular $WoE_1$ Obtengo 0 en $log$ denominador, porque $b_1 = 0$ . Al calcular $WoE_2$ Obtengo 0 en $log$ numerador, porque $g_2 = 0$ . ¿Tiene sentido?

3voto

user35546 Puntos 11

Es posible, y muy común, un IV superior a 1. Supongamos que se utiliza el logaritmo natural. Puedes deducir el límite utilizando dos categorías. Digamos que el modelo/característica puede separar perfectamente lo bueno y lo malo, y dejemos que $G_1, B_1, G_2, B_2$ sea la proporción de bienes y bienes que caen en las dos categorías. Entonces, dejemos que $G_1 \to 1, B_1 \to 0, G_2 \to 0, B_2 \to 1$ . Así que estamos asumiendo una gran piscina y el modelo es perfectamente separar los bienes / malos. Entonces es fácil comprobar que el IV es igual:

$\ln \left( \frac{G_1}{B_1}\right) -\ln \left( \frac{G_2}{B_2}\right) $

Y el signo menos delante del segundo significa que puedes invertir el segundo cociente, y por lo tanto es 2 veces el logaritmo de una cantidad que va al infinito, por lo que puedes obtener el infinito. Pero en la práctica deberías obtener IV de menos de 10 la mayoría de las veces.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X