Estoy leyendo el libro "Avances en ML Financiero" y me he quedado atascado con algo que no se cubre allí (corríjanme si me equivoco). Supongamos que etiqueté los datos como 0, 1, 2 según el método de triple barrera pero sé que mi modelo solo funcionará en un mercado de baja volatilidad. Entonces, una forma sería simplemente usar la volatilidad como una característica y dejar que ML haga su magia descubriendo todo, pero creo que resulta en más ruido que si excluyera explícitamente condiciones de mercado específicas del modelo (como un cambio de régimen). ¿Cómo debo adaptar mi enfoque de etiquetado para lograr este objetivo?
Respuesta
¿Demasiados anuncios?Usando el etiquetado de Triple Barrera, se utilizarían las etiquetas [-1, 0, 1] para indicar qué barrera se alcanzó primero. Deberías tener muy pocas etiquetas 0 y por lo tanto puedes eliminarlas de la muestra. Si tienes muchas etiquetas 0, entonces has establecido tus niveles de take profit y stop loss demasiado altos.
Para determinar los niveles de TP y SL, puedes usar datos sintéticos para determinar las reglas comerciales óptimas. El siguiente es el documento en el que se basa la técnica: Determining Optimal Trading Rules without Backtesting.
Si tu modelo solo funciona en un mercado de baja volatilidad, puedes hacer uso de la técnica de Meta-Labeling y ajustar un modelo secundario para ayudarte a filtrar los falsos positivos y determinar tamaños de apuesta óptimos.
Este modelo secundario se basará en características que serán predictivas de falsos positivos, por lo que características como volatilidad, correlación serial, sesgo, y así sucesivamente serán muy útiles.