Badacze przedstawiają metodę optymalizacji agentów reinforcement learning podczas fazy inference, która pozwala im planować strategie handlowe przed wykonaniem transakcji. Podejście łączy planowanie z uczeniem się, aby poprawić decyzje handlowe w złożonych warunkach rynkowych. Ta technika może znacząco zwiększyć rentowność algorytmicznych systemów tradingowych poprzez lepsze przewidywanie i adaptację do zmiennych warunków rynkowych.