CV Week 2024 l Лекция 6 RL tuning for diffusion models I ШАД

Спикер: Александр Шишеня, ведущий разработчик в Службе компьютерного зрения. На лекции рассмотрим подходы к финальному дотюниванию диффузионных моделей с помощью обучения с подкреплением: разберем базовый бэкграунд в обучении с подкреплением, как получаются «реворд» модели и более подробно обсудим DPO и PPO подходы. После окончания подключайтесь к лекции 7 YandexART — a production-grade diffusion model: Скачать презентацию по лекции: Материалы интенсива, которые уже прошли: Лекция 1 Introduction to diffusion models: Семинар 1 Basic diffusion implementation: Лекция 2 DPM formulation via SDE and ODE: Семинар 2 Implementing an efficient sampler: Лекция 3 Diffusion architectures. Training and sampling techniques. Text-to-image formulation: Семинар 3 Text-to-image generation: Лекция 4 Diffusion distillation. ODE-based methods: Лекция 5 ODE-free diffusion distillation: Семинар 4 Implementing text-to-image consistency models: Узнать больше о Школе анализа данных можно на сайте:
Back to Top