Allegro : открытая text-to-video модель генерации видео в 720p. Allegro - модель от Rhymes AI для генерации видео по текстовому
Allegro : открытая text-to-video модель генерации видео в 720p.
Allegro - модель от Rhymes AI для генерации видео по текстовому промпту. Allegro генерирует 6-секундные видеоролики с разрешением 720p и частотой 15 кадров в секунду. Модель отличается высокой детализацией, плавностью переходов в движении и способностью визуализировать сложные сцены.
Allegro основана на трех ключевых технологиях:
Обработка больших объемов видеоданных.
Для обучения модели использовался массив данных из 106 млн. изображений и 48 млн. видеороликов с детальными аннотациями.
Сжатие видео в визуальные токены.
В Allegro используется Video Variational Autoencoder (VideoVAE) с 175 млн. параметров. Он кодирует видео в компактное скрытое пространственно-временное представление и способен работать в разрядностях точности FP32/TF32/BF16/FP16.
Масштабируемая архитектура Diffusion Transformer.
Ядро Allegro - масштабируемая архитектура Diffusion Transformer (DiT) с 3D-позиционным кодированием RoPE и полным 3D-вниманием размером в 2.8 млрд. параметров. DiT моделирует пространственные и временные зависимости в видеокадрах и отвечает за качество генерации и плавность движения. Поддерживаемая разрядность - BF16/FP32/TF32.
Для локального запуска потребуются : Python >= , PyTorch >= 2.4, CUDA >= 12.4
Интерполяция до 30 FPS возможна с помощью EMA-VFI .
С использованием параметра —enable_cpu_offload, инференс возможен на VRAM, без использования выгрузки потребность Allegro около 27Gb VRAM.
Модель не может генерировать знаменитостей, разборчивый текст, конкретные места, улицы или здания.
Параметры инференса в CLI:
python
--user_prompt ’%prompt%’
--save_path ’%full path for output file%’
--vae ’%path to VAE’
--dit ’%path to DiT%’
--text_encoder ’%path to text encoder%’
--tokenizer ’%path to text tokenizer%’
--guidance_scale 7.5
--num_sampling_steps 100
--seed 42
Лицензирование: Apache 2.0 license.
Страница проекта
Модель
Arxiv
Сообщество в Discord
Demo
GitHub
1 view
11
3
3 days ago 00:04:35 1
[Мицуко Утида – тема] Mozart: Piano Sonata No. 16 in C Major, K. 545 “Sonata facile“: I. Allegro
3 days ago 00:10:54 1
Pyotr Tchaikovsky. Violin Concerto in D Major, Op. 35, TH 59_ III. Finale_ Allegro vivacissimo
3 days ago 00:21:14 4
[LazyNoob] TNO Super Events: Russian Reunification Compilation - Toolbox Theory 3 Update
4 days ago 00:02:12 5
Видео от Студия эстрадного танца «Аллегро»Коломенская 9с5
4 days ago 00:01:46 226
Видео от Клуб акробатического рок-н-ролла Аллегро | Тула
4 days ago 00:01:38 66
Видео от Танцевальная студия “Аллегро“
4 days ago 00:55:21 1
Antonín Dvořák. Концерт для виолончели с оркестром си минор (1895),
4 days ago 00:15:23 1
Пётр Чайковский (1840–1893). 6 пьес для фортепиано (1873), Op. 19
4 days ago 00:43:37 1
Сергей Рахманинов (1873–1943). Симфония №1 (1895),
4 days ago 00:32:03 1
Фридерик Шопен (1810–1849). Концерт для фортепиано с оркестром №2 фа минор (1829), Op. 21
4 days ago 00:38:43 1
Николай Мясковский (1881–1950). Концерт для виолончели с оркестром до минор, op. 66
4 days ago 00:37:43 1
Sergey Rachmaninov. Symphonic Dances, Op. 45
4 days ago 00:01:15 1
Выступление на концерте, посвященном Дню Мамы
4 days ago 00:03:48 1K
Видео от Хореографический ансамбль Арт-студия “АЛЛЕГРО“
4 days ago 00:01:50 1
Аллегро. Концерт “Краски осени “
4 days ago 00:00:47 1
Аллегро. Концерт “Краски осени“
4 days ago 00:03:53 1
Martha Argerich & Nicolas Economou: Mozart - Piano Sonata for four hands K. 381 (III. Allegro molto)
4 days ago 00:03:07 1
Martha Argerich & Nicolas Economou: Mozart - Piano Sonata for four hands K. 381 (I. Allegro)
4 days ago 00:00:56 131
Видео от Студия эстрадного и современного танца Allegro