12 января, 13:37

ElevenLabs запускает Scribe v2 с улучшенной точностью транскрипции

Video is not supported
Psy Eyes
Psy Eyes
Eleven Labs выпустили Scribe 2 Realtime для генерации текста из речи Модель заточена работать в реальном времени на 90 языках и подходит для агентов с голосовым режимом получения субтитров перевода итд Но фокус на агентах В отличие от предыдущей модели в линейке Scribe 2 Realtime лучше справляется с паузами дыханиями и шумами присущими человеческой речи Уже завезли в API Сайт Анонс
Video is not supported
OMG GPT: Midjourney, DeepSeek, IT
OMG GPT: Midjourney, DeepSeek, IT
ElevenLabs выпустили Scribe 2 Realtime речь в текст без задержек ElevenLabs представили Scribe 2 Realtime модель для распознавания речи в реальном времени Что важно работает на 90 языках ориентирована на голосовых ИИ агентов подходит для субтитров перевода стриминга лучше обрабатывает паузы дыхание и шумы характерные для живой речи Модель уже доступна в API и готова к интеграции в продакшен Итог ElevenLabs усиливают агентный стек распознавание речи становится стабильнее и человечнее