CV Week 2024 l Лекция 6 RL tuning for diffusion models I ШАД
Спикер: Александр Шишеня, ведущий разработчик в Службе компьютерного зрения.
На лекции рассмотрим подходы к финальному дотюниванию диффузионных моделей с помощью обучения с подкреплением: разберем базовый бэкграунд в обучении с подкреплением, как получаются «реворд» модели и более подробно обсудим DPO и PPO подходы.
После окончания подключайтесь к лекции 7 YandexART — a production-grade diffusion model:
Скачать презентацию по лекции:
Материалы интенсива, которые уже прошли:
Лекция 1 Introduction to diffusion models:
Семинар 1 Basic diffusion implementation:
Лекция 2 DPM formulation via SDE and ODE:
Семинар 2 Implementing an efficient sampler:
Лекция 3 Diffusion architectures. Training and sampling techniques. Text-to-image formulation:
Семинар 3 Text-to-image generation:
Лекция 4 Diffusion distillation. ODE-based methods:
Лекция 5 ODE-free diffusion distillation:
Семинар 4 Implementing text-to-image consistency models:
Узнать больше о Школе анализа данных можно на сайте: