Cuando se modela la dinámica de un mercado, se suele asumir que el impacto de una "pequeña" (por ejemplo, un porcentaje muy bajo del volumen de negociación diario) orden en las observaciones actuales y futuras del mercado ("observaciones" son cosas que se podrían utilizar para determinar cuánto de un activo se podría negociar por otro, por ejemplo, instantáneas del libro de órdenes para un intercambio centralizado, niveles de reserva de tokens para un intercambio descentralizado de creador de mercado automatizado, etc.) es casi inexistente o inexistente.
Entre otras cosas, esta suposición nos permite utilizar más fácilmente datos históricos para tareas como el backtesting de estrategias comerciales, ya que no tenemos que alterar los datos como resultado de nuestras acciones cada vez que se toma una acción.
Lo que me gustaría saber es si esta es una suposición potencialmente "peligrosa" y también qué se ha hecho para relajar esta suposición, ya que no importa cuán pequeña sea una orden, todavía se registra en las transacciones que han ocurrido y si esas están disponibles públicamente, hay potencial para situaciones como otros agentes actuando en el evento de la orden "pequeña" con órdenes propias que pueden no ser tan "pequeñas" en tamaño, etc.
¿Sería un posible remedio desarrollar nuestros modelos en un entorno en vivo? como permitirles pronosticar/comerciar/interactuar/evaluar en el mercado real que estamos tratando de modelar con una cantidad relativamente pequeña de capital en cierta medida de un marco de aprendizaje por refuerzo? ya que esto nos permite no tener que suponer cómo nuestras acciones podrían afectar al mercado, ya que vemos lo que sucede en tiempo real.