Курс Deep Reinforcement Learning:
Сезон курсов:
В шестой лекции:
Рассматриваются MDP с бесконечным пространством действий;
Обсуждается Policy Gradient теорема;
Выводятся алгоритмы Reinforce, A2C и DDPG
Наши соц.сети:
Telegram:
Вконтакте:
1 view
188
75
3 months ago 01:30:49 11
DRL Course | Introduction to Reinforcement Learning. Cross-Entropy Method