**Pure Acetone** @pureacetone@qoto.org · 2025-02-22T10:06:30Z

Pure Acetone @pureacetone@qoto.org

Step-Audio (от создателей Step-Video-T2V) — это среда с открытым исходным кодом для интеллектуального речевого взаимодействия, которая гармонизирует понимание и генерацию, поддерживая многоязычные разговоры, эмоциональные тона, региональные диалекты, регулируемые темпы речи и просодические стили (например, рэп).
Ключевые инновации включают 130B-параметрическую мультимодальную модель, генеративный движок данных для создания аудио-контента и гранулярный контроль голоса, что улучшает интеллект агентов при решении сложных задач.
https://github.com/stepfun-ai/Step-Audio

Feb 22, 2025, 10:06 · · Elk · · ·

Resources

Developers

What is Mastodon?

qoto.org

More…