2 votos

Formulación de Market Making

Estoy desarrollando un enfoque basado en aprendizaje profundo por refuerzo para la creación de mercados. Para implementar esto, necesito definir las acciones apropiadas y los pasos ambientales. Mientras hacía algunas investigaciones bibliográficas, me encontré con varias formulaciones de creación de mercados.

Por ejemplo, Avellaneda y Stoikov parecen estar utilizando el siguiente enfoque:

  • En el tiempo $0$, determinar y establecer las comillas $\delta^a$ y $\delta^b$
  • Durante el intervalo $[0, \Delta t]$ o ambas comillas se ejecutan (en cuyo caso se captura el spread y el inventario no cambia) o solo una comilla se ejecuta (en cuyo caso no se captura spread, se compra/vende la acción y el inventario aumenta/disminuye) o no se ejecuta ninguna comilla (en cuyo caso no sucede nada). Pero no importa lo que pase no cambiamos las comillas durante este intervalo.
  • En el tiempo $\Delta t $, determinar y establecer las nuevas comillas $\delta^a{'}$ y $\delta^b{'}$
  • El proceso se repite hasta algún tiempo terminal $T$

Es interesante notar que, según esta formulación, si por ejemplo la comilla de compra se ejecuta en $\frac{\Delta t}{5}$ y la comilla de venta en $\frac{2\Delta t}{5}$, el creador de mercado simplemente está esperando desde $\frac{2\Delta t}{5}$ hasta $\Delta t$ para establecer nuevas comillas.

Por el contrario, Fushimi, Rojas y Herman parecen estar empleando un enfoque algo diferente y más sofisticado, dado por el pseudocódigo a continuación. enter image description here

Naturalmente, también hay otras formulaciones más sofisticadas. Algunas de ellas incluyen cancelar la segunda orden tan pronto como se ejecute la primera. Debido a su simplicidad, prefiero el primer enfoque (Avellaneda-Stoikov). Sin embargo, parece algo simplista y poco sofisticado, e incluso no estoy seguro de si se utiliza en la práctica. Así que mi pregunta es: ¿es suficientemente bueno y realista el primer enfoque o debería optar por alguna alternativa?

2voto

John Rennie Puntos 6821

En primer lugar, hay una versión más general de Avellaneda-Stoikov aquí: Guéant, Olivier, C-A L., y Joaquin Fernandez-Tapia. "Dealing with the inventory risk: a solution to the market making problem" Mathematics and financial economics 7 (2013): 477-507.

Pero para el Aprendizaje por Refuerzo, sugiero echar un vistazo a los ejemplos de Mounjid, Othmane, y C-A L. "Improving reinforcement learning algorithms: towards optimal learning rate policies" Mathematical Finance (2019), que se trata de la colocación óptima de órdenes.

Es en este documento donde se analiza en detalle la colocación óptima de una orden: C-A L., y Othmane Mounjid. "Limit order strategic placement with adverse selection risk and the role of latency" Market Microstructure and Liquidity 3, no. 01 (2017).

Este último documento describe el mecanismo de la siguiente manera:

  • considerar una orden de tamaño $q$ en el libro de órdenes: en su cola tiene $Q^{bef}$ órdenes antes y $Q^{aft}$ después
  • y tiene una cantidad $Q^{opp}$ en la cola opuesta.

Para ser claro: si compro, mi cola es la (mejor) oferta y la cola opuesta es la (mejor) demanda. Las acciones posibles son

  • quedarse y esperar (si crees que serás consumido pronto)
  • cancelar e irte (si crees que el precio se está acercando rápidamente en tu dirección)
  • convertir tu orden en una orden de mercado (si crees que el precio pronto se alejará).

Si crees en el poder predictivo del desequilibrio, sabes que las tres posibles acciones están realmente impulsadas por el desequilibrio del libro. Por lo tanto, debería haber 2 umbrales, que se pueden leer en el desequilibrio, que cambiarán tus acciones.

(yendo más allá del documento) Si tienes más predictores, es más o menos la misma historia, pero en una dimensión superior: son regiones conectadas en el espacio efectivo de los predictores que corresponden a la acción óptima.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X