Para otros algoritmos (como máquinas de vectores soporte), se recomienda que los atributos de entrada son a escala de alguna manera (por ejemplo, poner todo en una [0,1] de la escala). He buscado en google ampliamente y no puede encontrar ninguna información sobre si esto debe hacerse para impulsar métodos, y en particular gradiente de árbol de impulsar.
Respuesta
¿Demasiados anuncios?hacer atributos de entrada es necesario aumentar la escala?
No. No es necesario. Es sólo una heurística [1]. Es principalmente motivado por el siguiente:
- A partir de la Función de Escalado de artículo:
Dado que el rango de valores de datos en bruto varía ampliamente, en algunos algoritmos de aprendizaje automático, objetivo y funciones no funcionarán correctamente sin la normalización. Por ejemplo, la mayoría de los clasificadores de calcular la distancia entre dos puntos la distancia. Si una de las características que tiene un amplio rango de valores, la distancia se regirá por esta característica particular. Por lo tanto, el rango de todas las características que debe de ser normalizada, de modo que cada característica contribuye aproximadamente en proporción a la final de la distancia.
En resumen,
- La recomendación para otros algoritmos como SVM es sólo 'recomendación'. No se garantiza mejor rendimiento, por ejemplo.
- Mi sugerencia es que si este paso es caro, vaya. Si no lo es, a continuación, comprobar para ver si la normalización no se deteriore el rendimiento en comparación con la construcción de un Gradiente impulsado árbol directamente y decidir en consecuencia.