Петр Кудеров | Введение в RL: Gymnasium, DQN, Actor-critic

Младший научный сотрудник AIRI, инженер-исследователь ФИЦ ИУ РАН Петр Кудеров рассказывает про RL. В начале семинара описывается библиотека Gymnasium, которая предоставляет разнообразный набор простых виртуальных сред для обучения RL агентов с единым интерфейсом их взаимодействия. Во второй половине практического занятия Петр рассказывает про реализации базовых методов глубокого RL (DQN и Actor-critic). Ссылка на тетрадку с заданием для самостоятельного заполнения: Ссылка на решение: Плейлист со всеми лекциями «Лето с AIRI»: Анонсы научных мероприятий всегда публикуются в Telegram-канале AIRI:
Back to Top