Calcular un tiempo de huelga preciso sin detalles adicionales es, en mi opinión, claramente imposible. Sobre la cuestión de cómo hacerlo con información adicional/supuestos:
Una solución sencilla sería hacer que M dependiera del tiempo: cuanto mayor sea el tiempo transcurrido, menor será M. Parece que usted no quiere hacer esto.
Problema de base
Supongamos ahora que M no depende del tiempo, y que B maximiza el valor presente de su beneficio (supongamos un tipo de interés constante $r$ ) menos el coste del esfuerzo de completar la tarea en el momento $t$ (indicada por $C_t$ ), por lo que el objetivo de B es
$$ \max_t \frac{\text{M}}{(1+r)^t} - C_t. $$
$C_t$ no depende del tiempo
Si además suponemos que $C_t$ es constante en el tiempo, entonces éste no sólo es decreciente en $t$ , pero disminuyendo a un tasa decreciente . (La segunda derivada respecto a $t$ es positivo). Esto significa que B no querrá perder ningún valor presente y resolverá el rompecabezas lo antes posible (cuando $r$ es bastante grande), o que a B no le importará mucho la pérdida y resolverá en la fecha límite (cuando $r$ es bastante pequeño).
B también pone dinero
Esto no se modifica porque B también deposita (bloquea) una cantidad de dinero ( $\text{M}_B$ ), ya que la pérdida $$ \text{M}_B - \frac{\text{M}_B}{(1+r)^t} $$ resultante también se está reduciendo a un ritmo cada vez menor.
$C_t$ depende del tiempo
Supongamos ahora que $C_t$ depende del tiempo, por ejemplo, B tiene que estar en el cine durante las próximas tres horas y sólo puede resolver el rompecabezas después, o los costes computacionales hacen que sea costoso alquilar potencia de cálculo adicional y reducir el tiempo. Si hay casos en los que $C_t$ aumenta a un ritmo creciente, es decir $C_{t+2} - C_{t+1} > C_{t+1} - C_{t}$ entonces es posible que el problema de maximización tenga una solución interior, es decir, que el tiempo óptimo sea mayor que cero pero menor que el plazo. Sin embargo, esto sólo se puede calcular si se conoce el tipo de interés $r$ así como la función de coste de B, por lo que hay que obtener bastante información de B.
$r$ depende del tiempo
Curiosamente si permitimos $r$ variar, es decir, el tipo de interés es $r_t > 0$ en el momento $t$ no hay muchos cambios. En el $C_t$ no depende del caso del tiempo, el problema se resolverá de nuevo inmediatamente o justo en la fecha límite. Si $C_t$ depende del tiempo, es posible una solución interior, pero para calcular el tiempo óptimo necesitamos un montón de información/supuestos adicionales.