Stable Video 4D : Модель для динамической генерации видео с разных ракурсов
️ Stable Video 4D : Модель для динамической генерации видео с разных ракурсов.
Stable Video 4D - модель генерации видео от Stability AI, способная преобразовывать одиночное видео объекта в несколько новых видео с различных ракурсов с поддержкой согласованности внешнего вида объекта по пространственным и временным осям..
Модель использует комбинацию из четырех визуальных энкодеров (SigLIP, CLIP, DINOv2 и OpenCLIP ConvNeXt) и пространственный агрегатор зрения для создания 5 кадров для каждого из 8 ракурсов примерно за 40 секунд.
В Stable Video 4D пользователю доступны параметры:
Входное видео: загрузка одиночного видео объекта, которое будет использоваться как основа для генерации новых ракурсов. Поддерживаемые форматы — .gif, .mp4 или секвенция кадров в формате .png\.jpeg\.jpg;
3D-позиции камеры: указание конкретных ракурсов и углов обзора, с которых модель должна сгенерировать новые видео;
Количество кадров: по умолчанию модель генерирует 5 кадров для каждого ракурса, но этот параметр может быть изменен;
Количество ракурсов: стандартно модель создает 8 новых ракурсов, но пользователь может настроить это количество в зависимости от своих потребностей;
Количество шагов оптимизации: регулировка количества шагов, затрачиваемое на 4D-оптимизацию, чем больше шагов - тем лучше результат.
Технические рекомендации по запуску официально не публиковались, но в сообществе пользователей подтверждают о возможности запуска Stable Video 4D на 16 GB VRAM.
Для локального запуска необходимы модели:
Stable Video 3D_U
Stable Video 3D_P
Stable Video 4D
Локальный запуск Stable Video 4D :
с автозагрузкой моделей и дефолтными параметрами
python scripts/sampling/ —input_path assets/ —output_folder outputs/sv4d
с настраиваемыми параметрами
python scripts/sampling/ —input_path — — — —output_folder_path
Лицензирование :
бесплатно для исследовательского, некоммерческого и коммерческого использования организациями и частными лицами, получающими годовой доход в размере до 1 млн USD;
для коммерческого использования организациями и частными лицами, получающими годовой доход в размере, превышающим 1 млн USD - запрос-консультация через форму
Страница проекта
Модель на HF
6 views
32
12
11 months ago 00:07:33 1
0165 Лучшие бесплатные уроки по моушн-графике на Timesaver VFX
11 months ago 03:11:21 1
Soviet Union Music Records 1939 - relax/study to 📻 Old aesthetic sound
11 months ago 00:08:15 1
Как сделать анимацию и озвучить ФОТО, КАРТИНКУ, АВАТАРА за 1 минуту !
11 months ago 00:04:40 1
Is Liz Gunn’s Star Witness Mentally Stable?
11 months ago 00:41:16 1
Weltgefahr: Höchstgrad-Freimaurerei
11 months ago 00:05:47 1
Новогодний Салат ГЛАЗ ДРАКОНА Очень Вкусно и Красиво!!! / Праздничный Салат / Dragon’s Eye
11 months ago 00:19:20 1
ТОП-10 НЕЙРОСЕТЕЙ В 2023 году
11 months ago 00:03:52 1
Видео созданные ИСКУССТВЕННЫМ интеллектом (ИИ)
11 months ago 00:45:53 1
Крутая конюшня
11 months ago 00:47:31 1
The End of Art: An Argument Against Image AIs
11 months ago 00:06:33 1
Обученные модели Stable Diffusion, запуск на Hugging Face
11 months ago 00:08:22 1
СУПЕР возможности в 1 клик! Установка 30 нейросетей на пк!
11 months ago 00:05:18 1
LUMEN - Гореть (2023) | official video
11 months ago 00:03:44 1
Robocop as a Japanese Anime
11 months ago 00:10:35 1
10 Minute Ultimate Abs Workout | KILLER RESULTS!
11 months ago 00:12:40 1
PSALM 90 / 91 (Gregorian chant)
11 months ago 00:04:03 1
SYNTH10, GREENLY - FIND ME (2023) #synthwave #retrowave (stable diffusion music video)
11 months ago 00:11:42 1
Замена лица по одному изображению с ROOP
11 months ago 00:09:21 1
MidJourney - Как Пользоваться Бесплатно и Без Ограничений ?! | Нейросеть Stable Diffusion
11 months ago 00:09:33 1
How to Build a Rolling Workbench for your Garage in One Day! [$100 build]
11 months ago 00:03:14 1
4K, Laura’s Ai Art, Ai Lookbook,Picnic part 2
11 months ago 00:05:14 5
Peter Gabriel - Panopticom (Dark-Side Mix) (Vnderworld Official Video)