DRL Course 2023 | Value Function Approximation. Deep Q-Networks (DQN)
Курс Deep Reinforcement Learning 2023:
Сезон курсов :
В пятой лекции:
Рассматриваются MDP с бесконечным пространством состояний
Обсуждаются аппроксимации Q-функции с помощью линейной комбинации и нейронных сетей
Выводится алгоритм Deep Q-Networks (DQN)
Обсуждаются его различные модификации
Автор курса: Антон Плаксин, исследователь в группе и доцент Уральского федерального университета.
Наши соц.сети:
Telegram:
Вконтакте:
Канал с вакансиями в telegram:
Канал с апдейтами по курсам:
Как попасть в чат сообщества ODS Mattermost:
15 views
304
79
3 months ago 01:30:49 11
DRL Course | Introduction to Reinforcement Learning. Cross-Entropy Method