Step-Video-T2V — это усовершенствованная текст-видео модель с 30 миллиардами параметров, способная генерировать видео до 204 кадров.
👀😎🤷♀️🧵
Модель Step-Video-T2V позволяет создавать видео по текстовым описаниям, длиной до 10 секунд, в том числе с изображениями известных личностей.
Для достижения наилучшего качества рекомендуется использовать GPU с 80 гигабайтами памяти. Успех генерации видео также зависит от оптимизации параметров вывода.