Por lo que sé, suele haber un término medio a la hora de elegir el valor correcto de un umbral. Hay que encontrar un equilibrio entre el sesgo y la varianza.
Si se elige un umbral bajo, el número de observaciones (superaciones) aumenta y la estimación se vuelve más suave.
Sin embargo, un umbral bajo también introduce algunas observaciones del centro de la distribución y la estimación se vuelve sesgada.
Por otra parte, un umbral relativamente alto elimina los valores que habrían formado parte de los extremos, lo que supone una mayor varianza en las estimaciones.
¿Cómo sé que el valor de un umbral elegido se ajusta para producir los mejores resultados? Además, si tengo que hacer un balance entre , ¿qué valdría la pena? ¿Pasar por alto el sesgo y garantizar una varianza mínima o renunciar a la varianza y combatir el sesgo? ¿Qué es mejor? ¿Hay algún texto al que pueda recurrir?