
Эксплойт
Клонируем голос за ТРИ СЕКУНДЫ вышла LuxTTS лёгкая модель для синтеза речи которая умеет копировать чужой голос по короткому аудиофайлу Тулза делает голосовые дипфейки доступными буквально каждому Работает всё просто даёте нейросети несколько секунд записи человека а дальше она может читать любой текст тем же голосом Причём звучит это довольно реалистично качество до 48 кГц как у нормальной записи Самое безумное скорость Модель генерирует речь в 150 раз быстрее реального времени То есть минутный текст она может озвучить за доли секунды При этом нейросеть очень лёгкая ей нужно меньше 1 ГБ видеопамяти поэтому её можно запускать даже на обычном ПК или ноутбуке локально Забираем здесь exploitex

Чёрный Треугольник
xAI запустила свой Text to Speech API Компания Илона Маска официально открыла разработчикам доступ к TTS API на базе ИИ Grok Главная фишка управление эмоциями и интонацией прямо из текста Разработчик может написать в запросе laugh pause sigh обернуть фрагмент в теги whisper или slow и модель отрендерит это с нужной подачей смехом паузой шёпотом замедлением Никакой дополнительной настройки не требуется всё читается из входного текста На старте доступно 5 голосов с разным характером Eve энергичный для презентаций Ara тёплый для разговорных интерфейсов Rex уверенный бизнес стиль Sal универсальный Leo авторитетный для обучающего контента API поддерживает 20 языков включая русский с автоматическим определением языка то есть модель сама разберётся на каком языке написан текст и произнесёт его корректно При необходимости язык можно задать явно через BCP 47 код Форматы вывода MP3 WAV PCM а также G 711 μ law и A law которые являются стандартом для телефонии Максимальный объём одного запроса 15 000 символов Стоимость 4 20 за 1 миллион символов Помимо простого TTS у xAI работает полноценный Voice Agent API голосовой агент в реальном времени через WebSocket Он занимает первое место в бенчмарке Big Bench Audio среднее время до первого аудиоответа менее одной секунды что примерно в 5 раз быстрее ближайших конкурентов Стоимость 0 05 в минуту Весь голосовой стек xAI построила с нуля собственная модель обнаружения голосовой активности VAD токенизатор и аудиомодели что позволяет быстро итерировать и улучшать качество API совместим со спецификацией OpenAI Realtime API так что миграция с конкурента минимальна TTS API пока находится в бета статусе цены и лимиты могут измениться после полного релиза Но попробовать все 5 голосов уже можно бесплатно в плейграунде без банковской карты News Soft Hacker
Источники
Похожие новости



+4














+5



+10

OpenAI интегрировала Codex в мобильное приложение ChatGPT
Технологии
15 часов назад


+4
Threads запускает ИИ-бота Meta AI в пяти странах, пользователи выражают недовольство
Технологии
1 день назад



Сотрудники крупных компаний используют ИИ для накрутки внутренних метрик
Технологии
21 час назад



Конференция AI2Business и прием докладов на Saint HighLoad 2026: внедрение ИИ в бизнес и разработку
Технологии
1 день назад


Глобальный диктант по осетинскому языку пройдет 14 мая в прямом эфире
Общество
11 часов назад


+5
Telegram внедрил поиск по 100 миллионам стикеров и эмодзи на 36 языках
Технологии
1 день назад


+10