Stabilising Experience Replay for Deep Multi-Agent Reinforcement Learning

Многие задачи реального мира естественно моделировать как системы, состоящие из множества агентов, скооперированных друг с другом. Подобные задачи полезно решать методами мультиагентного обучения в подкреплением, т.к. они обладают многими преимуществами по сравнению с методами для обучения одного агента. Однако данные модели содержат некоторые проблемы. Например, для такой популярной модели как independent Q–learning невозможно эффективно использовать подход experience replay memory для глубоких нейронных с
Back to Top