Microsoft представляет VibeVoice для генерации многоголосой речи и подкастов

Video is not supported

Microsoft выпустили модель VibeVoice для генерации речи из текста в режиме реального времени VibeVoice позволяет создавать длинные диалоги сразу с несколькими участниками виртуальные голоса даже умеют петь Можно взять любой текст и сгенерировать часовой подкаст Тестируем здесь

Технологии160 дней назад

Video is not supported

PROJECT+ | Нейросети

Microsoft выпустила VibeVoice Realtime 0 5B лёгкую открытую модель озвучки которая начинает говорить почти мгновенно задержка около 300 мс и тянет длинные реплики без ощутимой просадки по качеству Её можно крутить локально или на недорогих серверах так что подходит для живых голосовых ассистентов стриминговых интерфейсов и любых говорящих ИИ где важна реакция в реальном времени Веса и примеры запуска лежат на Hugging Face Service Подписаться

Технологии159 дней назад

Video is not supported

Ринат Шакиров | Промпты для Midjourney | ChatGPT

Microsoft научили ИИ создавать многочасовые подкасты и заставили голоса петь Microsoft представила VibeVoice новую модель для мгновенной озвучки текста Технология умеет генерировать протяженные беседы с несколькими виртуальными собеседниками одновременно а искусственные голоса способны не только говорить но и исполнять песни Достаточно загрузить текст и система создаст полноценный часовой аудиоподкаст Тестить тут новости dailyprompts

Технологии159 дней назад

Microsoft представляет VibeVoice для генерации многоголосой речи и подкастов

Источники

Violin: Новый опенсорсный инструмент для дубляжа видео на 33 языка

Программист создал ИИ-клона для борьбы с одиночеством и улучшения психического здоровья

Microsoft исследует ограничения ИИ в офисной работе

OpenAI анонсировала синхронизацию ChatGPT с банковскими счетами пользователей

Мальта предоставляет бесплатный доступ к ChatGPT Plus для всех граждан через курс AI for All

ВКонтакте и Грамота.ру представили топ популярных регионализмов России

Microsoft представляет VibeVoice для генерации многоголосой речи и подкастов

Ещё по теме

Источники

Violin: Новый опенсорсный инструмент для дубляжа видео на 33 языка

Программист создал ИИ-клона для борьбы с одиночеством и улучшения психического здоровья

Microsoft исследует ограничения ИИ в офисной работе

OpenAI анонсировала синхронизацию ChatGPT с банковскими счетами пользователей

Мальта предоставляет бесплатный доступ к ChatGPT Plus для всех граждан через курс AI for All

ВКонтакте и Грамота.ру представили топ популярных регионализмов России