DRL Course | Value Function Approximation. Deep Q-Networks (DQN)
Курс Deep Reinforcement Learning:
Сезон курсов:
В пятой лекции:
Рассматриваются MDP с бесконечным пространством состояний;
Обсуждаются аппроксимации Q-функции с помощью линейной комбинации и нейронных сетей;
Выводится алгоритм Deep Q-Networks (DQN);
Обсуждаются его различные модификации
Наши соц.сети:
Telegram:
Вконтакте:
10 views
192
63
3 months ago 01:30:49 11
DRL Course | Introduction to Reinforcement Learning. Cross-Entropy Method