8 декабря, 14:32

Microsoft представляет VibeVoice для генерации многоголосой речи и подкастов

Video is not supported
NN
NN
Microsoft выпустили модель VibeVoice для генерации речи из текста в режиме реального времени VibeVoice позволяет создавать длинные диалоги сразу с несколькими участниками виртуальные голоса даже умеют петь Можно взять любой текст и сгенерировать часовой подкаст Тестируем здесь
Video is not supported
PROJECT+ | Нейросети
PROJECT+ | Нейросети
Microsoft выпустила VibeVoice Realtime 0 5B лёгкую открытую модель озвучки которая начинает говорить почти мгновенно задержка около 300 мс и тянет длинные реплики без ощутимой просадки по качеству Её можно крутить локально или на недорогих серверах так что подходит для живых голосовых ассистентов стриминговых интерфейсов и любых говорящих ИИ где важна реакция в реальном времени Веса и примеры запуска лежат на Hugging Face Service Подписаться