Conditioning of Reinforcement Learning Agentsand its Policy Regularization Application

Ролик записан к постеру на конференции ICML 2020, Bias and Generalization in RL Workshop. Спикер — Арип Асадулаев, научный сотрудник и аспирант лаборатории машинного обучения ИТМО. В презентации дано краткое описание проблемы обусловленности матрицы Якобиана агентов обучения с подкреплением, а также представлены результаты применения техник регуляризации обусловленности для ряда задач. Ссылка на полную статью “Conditioning of Reinforcement Learning Agents and its Policy Regularization Application“: h
Back to Top