He escrito un modelo para predecir el ganador de peleas de la UFC.
Mi modelo calcula la probabilidad de cada luchador para ganar un partido determinado.
He probado de nuevo el modelo y encontrado para ser muy preciso, que predice el ganador de alrededor de 65% del tiempo. El modelo está entrenado en 3 años de datos y, a continuación, prueba de muestra, que en los últimos 9 meses de datos.
Estoy tratando de usar mi resultado del modelo (de la muestra) y libro histórico fabricante de probabilidades de llegar a una óptima estrategia de apuestas. Esto se basa en el Criterio de Kelly.
Tengo 5 parámetros que creo que va a afectar a la rentabilidad de una estrategia de apuestas. Ellos se basan en torno a las fracciones para kelly, y el manejo de la incertidumbre.
Lo que hice es escribir un programa para crear ~500k estrategias con diferentes pesos para cada parámetro. Entonces corro con ellos a través de los últimos 9 meses de datos para determinar su rentabilidad.
A partir de los ~500k puedo estrechar abajo las estrategias que estoy interesado en filtrarlos por máximo draw down (20%) y el mínimo retorno de la inversión (25%), esto traerá las estrategias a alrededor de 20k.
¿Cómo puedo reducir aún más las estrategias en una óptima?
Si me tome la mejor estrategia (la mayoría de las ganancias durante los 9 meses de la salida de datos de la muestra), me preocupa que es probable super over ajuste, y si puedo tomar el promedio de cada parámetro para cada uno de los 20k estrategias me preocupa que este conjunto de parámetros no pueden trabajar bien juntos.
¿Cómo puedo reducir el ~20k estrategias en uno que funciona bien y es probable que no se ajuste?
Gracias por tu ayuda.