6 июня, 06:37

ElevenLabs представили новую версию TTS движка v3 с поддержкой аудиотегов и диалогов

БлоGнот
БлоGнот
ElevenLabs выкатили новую версию своего TTS движка — v3 пока в стадии alpha и доступна только через сайт, публичный доступ к API скоро будет. Новая версия поддерживает аудиотэги — то есть разметку текста, позволяющую управлять генерацией голоса, — и лучше понимает читаемый текст. Кроме того, можно сгенерировать диалог нескольких спикеров, причем всё это неплохо поддерживается на более чем 70 языках. Правда, использование всех возможностей требует определенной работы над промптом, но это лучше, чем раньше, когда из всех возможностей была только пауза до 3 секунд. Учитывая, что это альфа-версия, можно простить нестабильность результатов и некоторое отсутствие регулировок — например, в половине случаев мой текст начинали читать очень не торопясь, а одна из вариаций рекламного ролика оставила ощущение, что диктор бежит за аудиторией по шумной улице и кричит вдогонку. Но все равно стоит смотреть, если вам нужно что-то озвучивать.
Нейросети & Технологии | DeepTech
Нейросети & Технологии | DeepTech
ElevenLabs представили Eleven V3: Новый шаг в генерации речи Компания ElevenLabs анонсировала свою новейшую и самую передовую модель для синтеза речи — Eleven V3. Теперь искусственно создаваемые голоса стали практически неотличимы от реальных, и была добавлена функция диалогов. Вариантов в промтах стало больше: можно включать крик, кашель или изменять тональность беседы, что делает ответы ИИ более выразительными и разнообразными. Пробуем по ссылке. ———————————————— - Канал про тренды из мира IT, технологий, нейросетей и бизнеса.
CGIT_Vines
CGIT_Vines
Ух, Elevenlabs выпустили V3-версию в паблик-альфу. Попробовать её можно с 80% скидкой до конца июня. Предустановленные интонации работают отлично: растягивание речи, паузы — они сейчас определённо лучшие на рынке. Но я могу сказать, что посидел какое-то время с генерациями голоса, и проблема вот в чём: даже если вы сделали всё вышеперечисленное, подобрали тон, написали хороший, естественный текст что важно , выбрали правильный голос, попали во все ударения, особенно в русском, — то остаётся одна проблема. Они всё равно читают как дикторы. Слишком идеально. Там нет человеческой ошибки. Над этим я сейчас и работаю. И у Elevenlabs эта проблема тоже есть, хоть и апдейт определённо шаг вперёд.
Postium: интернет-медиа
Postium: интернет-медиа
ElevenLabs научился озвучивать диалоги, как в кино. В новой версии модели ElevenLabs V3 можно создавать полноценные диалоги с эмоциями, акцентами и звуками. Есть поддержка русского языка. ИИ понимает теги вроде [angry], [whispers], [laughs], добавляет паузы, вздохи и даже сарказм. Можно задавать любое количество голосов, управлять их тоном и настроением. И да, пока всё это доступно даже в бесплатной версии.
Чёрный Треугольник
Чёрный Треугольник
ElevenLabs представила Eleven v3 — новый ИИ текст-в-речь Eleven v3 alpha предлагает предлагает более высококачественное озвучивание с эмоциями и естественными звуками. Инструмент способен менять тон, варьировать акценты и даже петь, что выделяет его среди традиционных голосовых решений. Eleven v3 поддерживает более 70 языков, включая русский, и нацелен на широкий круг пользователей — от контент-создателей до разработчиков приложений. В будущем ожидается добавление функций для работы в реальном времени с голосовыми помощниками и чат-ботами, а также возможность интеграции через публичный API. Доступ к Eleven v3 уже предоставляется на сайте. ================ News Soft Gear Links
vc.ru
vc.ru
Сервис для синтеза речи ElevenLabs выпустил модель v3 с поддержкой «эмоций». В тексте для озвучки теперь можно прописать теги, например [вздох] или [смех]. Она доступна бесплатно vc.ru/ai/2029832
Loading indicator gif
Спроси что угодно — умный ИИ уже готов ответить
1chatgpt.ru
1chatgpt.ru
Спроси что угодно — умный ИИ уже готов ответить
Нейродвиж
Нейродвиж
ElevenLabs выпустили ЛУЧШУЮ модель для генерации голоса Eleven v3 alpha и она просто нереальная Главный апдейт: нейросеть теперь понимает аудиотеги, чтобы вы могли сделать голос более выразительным. Например, можно контролировать эмоции, прописав [sad], [angry], [happily] и т. д., или заставить ИИ шептать/кричать. Еще из интересного: возможность генерировать диалоги, причем количество спикеров не ограничено. Также теперь генерируется сразу два аудио, чтобы вы проще и быстрее могли получить желаемый результат. САМОЕ ГЛАВНОЕ: модель доступна даже бесплатным пользователям дают 10 000 кредитов , еще и на весь июнь действует скидка 80% на генерацию новой моделью использует меньше токенов . Есть промт-гайд по использованию тегов. Подрубаем VPN и пробуем — здесь.
AI и точка.
AI и точка.
Студия ElevenLabs выпустила новую модель для озвучки текста Eleven v3. Нейросеть теперь говорит на 74 языках, создает диалоги с несколькими спикерами в одной генерации и понимает аудиотеги. ИИ на ходу может менять настроение, переходить на шепот, натурально смеяться, плакать или имитировать акценты. Протестировать бесплатно можно здесь. Также ElevenLabs выпустила гайд по промптингу для новой модели с описанием работы с аудиотегами.
NEUROHUB🔥
NEUROHUB🔥
ElevenLabs выкатили МОЩНУЮ модель для генерации озвучки — Eleven V3. Новая модель выдает уровень киношного дубляжа. Вот что прокачали: Голос реагирует на теги: можно добавить [angry], [sad], [whispering] — и он реально будет шептать, злиться или грустить. Поддержка диалогов без ограничения количества спикеров — удобно для подкастов, скетчей и историй. Сразу два аудио на выходе — можно выбрать лучший вариант; Работает даже на фри-плане дают 10.000 бесплатных кредитов . Пробуем по ссылке.
ElevenLabs выпустила сумасшедшую обнову    Компания анонсировала новую версию своей модели text-to-speech — Eleven v3  alpha .  Она отличается невероятной реалистичностью: передаёт эмоции, меняет интонацию и даже воспроизводит смех или вздохи.  По словам разработчиков, теперь синтезированная речь звучит так же естественно, как у профессионального актёра.    Пользователи могут управлять голосом с помощью специальных команд, например [шёпот] или [пение], а также менять акценты и создавать диалоги между разными персонажами.  Источник
Технопроходцы
Технопроходцы
ElevenLabs выпустила сумасшедшую обнову Компания анонсировала новую версию своей модели text-to-speech — Eleven v3 alpha . Она отличается невероятной реалистичностью: передаёт эмоции, меняет интонацию и даже воспроизводит смех или вздохи. По словам разработчиков, теперь синтезированная речь звучит так же естественно, как у профессионального актёра. Пользователи могут управлять голосом с помощью специальных команд, например [шёпот] или [пение], а также менять акценты и создавать диалоги между разными персонажами. Источник
Loading indicator gif