
Psy Eyes
Eleven Labs выпустили Scribe 2 Realtime для генерации текста из речи Модель заточена работать в реальном времени на 90 языках и подходит для агентов с голосовым режимом получения субтитров перевода итд Но фокус на агентах В отличие от предыдущей модели в линейке Scribe 2 Realtime лучше справляется с паузами дыханиями и шумами присущими человеческой речи Уже завезли в API Сайт Анонс
Технологии2 дня назад

OMG GPT: Midjourney, DeepSeek, IT
ElevenLabs выпустили Scribe 2 Realtime речь в текст без задержек ElevenLabs представили Scribe 2 Realtime модель для распознавания речи в реальном времени Что важно работает на 90 языках ориентирована на голосовых ИИ агентов подходит для субтитров перевода стриминга лучше обрабатывает паузы дыхание и шумы характерные для живой речи Модель уже доступна в API и готова к интеграции в продакшен Итог ElevenLabs усиливают агентный стек распознавание речи становится стабильнее и человечнее
Технологии5 часов назад
Похожие новости



+5



+1






+6






DeepSeek анонсирует запуск модели V4 с улучшенными возможностями кодирования
Технологии
1 день назад


+5
Рост зарплат в IT-секторе России: эксперты прогнозируют изменения на 2025-2026 годы
Экономика
3 часа назад


+1
Линус Торвальдс использует AI для создания нового проекта AudioNoise
Технологии
1 час назад


Исследование: Собаки способны запоминать слова, подслушивая хозяев
Наука
1 день назад


+6
Рост потребности в специалистах по ИИ в России опережает развитие рынка
Общество
23 часа назад



Higgsfield представляет технологию превращения мультфильмов в фильмы с реальными актерами
Общество
1 день назад