Creo que el agrupamiento es el enfoque superior en la mayoría de los casos.
Soy un profesional en el campo y he utilizado tanto continua transforma y el agrupamiento de los enfoques.
En términos prácticos, en un modelo que no sería de alrededor de 10 factores. Si su modelo de desarrollo conjunto de datos es grande y lo suficientemente robusta, que fácilmente podría haber desechado cada uno de los 10 factores en 10 bandejas. A grandes rasgos, el uso de la binned cuadro de mandos entonces, usted puede asignar $10^{10}$ puntajes diferentes a sus clientes. Esta es la forma más grande que cualquier base de clientes del banco. Así que no te preocupes demasiado acerca de su modelo de no ser granular suficiente. En la mayoría de los casos será.
Para conjuntos de datos con tamaño pequeño de la muestra, es probable que terminan con los contenedores adyacentes con un gran punto diferenciales. Esto no es deseable! Usted no quiere que su cliente puntuaciones de cambiar tan drásticamente si él/ella es simplemente moviendo a la adyacente bin en uno de los factores. En la práctica he superado esto, simplemente, por el empleo de un sistema automatizado de algoritmo de agrupamiento de los datos, y de arranque de 100 veces. Si usted piensa de agrupamiento como un paso de la función que asigna valores sin procesar a un AY, a continuación, simplemente tomando el promedio de los 100 bootstrap binning será, naturalmente, suavizar saltos bruscos en la AFLICCIÓN. Esto hará que el gran punto diferencial problema desaparece. Este método es completamente basada en datos y no necesita ninguna otra subjetiva de entrada.
En otras aproximaciones en las que una función continua está equipado el analista de la construcción del modelo a menudo tienen que buscar en limitar el rango de valores donde la curva debe ser ajustada. Esto podría ser debido a la muestra de datos de no ser lo suficientemente robusta como cerca de los extremos de la distribución (por ejemplo, para las variables de renta, muy pocos de sus clientes estarían ganando \$10 millones+, así que alguien tiene que subjetiva de elegir el lugar para dejar de montar en la función de decir en $1 millón). Esto es todo manual y no se prestan bien a la automatización. El bootstrap binning enfoque en los párrafos anteriores se evita este problema.
Binning enfoque también es más fácil de implementar como una serie de declaraciones y si debería ser suficiente.
En general, aunque yo lo uso continuo transforma a veces, prefiero binning y utilizarlo siempre que es posible. Si el tamaño de la muestra es muy pequeño y tiene menos de 30 valores predeterminados para aplicar incluso binning, entonces es posible que desee relajarse la mala definición y alargar su periodo de observación. Sin embargo, incluso si eso no da su total malo cuenta hasta alrededor de 60~70 continuo de transformación podría ser el camino a seguir.