Psy Eyes
Eleven Labs выпустили Scribe 2 Realtime для генерации текста из речи Модель заточена работать в реальном времени на 90 языках и подходит для агентов с голосовым режимом получения субтитров перевода итд Но фокус на агентах В отличие от предыдущей модели в линейке Scribe 2 Realtime лучше справляется с паузами дыханиями и шумами присущими человеческой речи Уже завезли в API Сайт Анонс
OMG GPT: Midjourney, DeepSeek, IT
ElevenLabs выпустили Scribe 2 Realtime речь в текст без задержек ElevenLabs представили Scribe 2 Realtime модель для распознавания речи в реальном времени Что важно работает на 90 языках ориентирована на голосовых ИИ агентов подходит для субтитров перевода стриминга лучше обрабатывает паузы дыхание и шумы характерные для живой речи Модель уже доступна в API и готова к интеграции в продакшен Итог ElevenLabs усиливают агентный стек распознавание речи становится стабильнее и человечнее
Похожие новости +4 +5 +10 +7
Конференция AI2Business и прием докладов на Saint HighLoad 2026: внедрение ИИ в бизнес и разработку
Технологии
1 день назадOpenAI интегрировала Codex в мобильное приложение ChatGPT
Технологии
14 часов назадГлобальный диктант по осетинскому языку пройдет 14 мая в прямом эфире
Общество
9 часов назадСотрудники крупных компаний используют ИИ для накрутки внутренних метрик
Технологии
20 часов назадTelegram внедрил поиск по 100 миллионам стикеров и эмодзи на 36 языках
Технологии
1 день назадРоботы Helix 02 от Figure AI успешно отработали 8-часовую смену на производственной линии
Технологии
1 день назад