Обучение с подкреплением. Лекция 2. Марковский процесс принятия решений (2020)

В рамках лекции рассмотрены следующие понятия: – состояние, действие, политика, коэффициент дисконтирования, state value function; – марковский процесс; – марковский процесс с наградами; – марковский процесс принятия решений. Евгений Разинков -- к.ф.-м.н., руководитель отдела машинного обучения и компьютерного зрения Группы компаний FIX, ассистент кафедры системного анализа и ИТ института ВМиИТ Казанского федерального университета. Информация о лекциях: Телеграм-канал с анонсами л
Back to Top