7 мая, 21:07

OpenAI представила новые голосовые модели для улучшения диалогов и перевода в реальном времени

Редакционное саммари

OpenAI анонсировала выпуск трех новых голосовых моделей, предназначенных для улучшения взаимодействия с искусственным интеллектом. Эти модели, доступные через Realtime API, способны обрабатывать сложные диалоги, переводить речь в реальном времени и транскрибировать аудио. Первая модель, GPT Realtime 2, демонстрирует уровень рассуждений, сопоставимый с GPT 5, и может удерживать контекст на протяжении длительных разговоров благодаря увеличенному контекстному окну до 128 тысяч токенов. Это позволяет моделям более естественно вести диалоги, включая возможность перебивать себя и вызывать инструменты для решения задач в процессе общения. Вторая модель, GPT Realtime Translate, обеспечивает потоковый перевод с 70 языков на 13, учитывая темп речи говорящего. Третья модель, GPT Realtime Whisper, предназначена для транскрибации речи в режиме реального времени, что может быть полезно для создания субтитров и заметок. Эти инновации могут значительно изменить подход к взаимодействию с AI, улучшая качество общения и расширяя возможности использования технологий в различных сферах, таких как образование, бизнес и развлечения. Внедрение таких моделей может привести к более эффективным и интуитивным интерфейсам, что, в свою очередь, повысит доступность информации и упростит коммуникацию между людьми и машинами.
Machinelearning
Machinelearning
Еще OpenAI выкатила GPT Realtime 2 голосовую модель нового поколения для API Api позволяет делать realtime собеседников которые могут слушать рассуждать перебивать себя по ходу диалога вызывать инструменты и решать задачи прямо во время разговора Что вышло GPT Realtime 2 модель для production voice agents с reasoning уровня GPT 5 обработкой перебиваний tool calls и более живым диалогом GPT Realtime Translate потоковый перевод в реальном времени более 70 входных языков и 13 выходных GPT Realtime Whisper потоковая транскрибация речи для субтитров заметок и live конспектов openai com index advancing voice intelligence with new models in the api ai machinelearning big data
vc.ru
vc.ru
OpenAI представила три аудиомодели для ИИ агентов Одна умеет рассуждать на уровне GPT 5 и лучше предшественницы удерживает контекст контекстное окно увеличили до 128 тысяч токенов Другие две предназначены для синхронных переводов и расшифровок Все три доступны в Realtime API vc ru ai 2915334 На видео пример как работает модель для перевода
OpenAI выпустила три новые голосовые модели Они одновременно слушают рассуждают и переводят текст  GPT Realtime 2 голосовая модель с рассуждением уровня GPT 5 для живых диалогов умеет обрабатывать сложные разговоры и естественно вести диалог  GPT Realtime Translate модель перевода в реальном времени которая переводит речь с 70 языков на 13 языков учитывая темп речи говорящего  GPT Realtime Whisper расшифровывает речь в режиме реального времени по мере того как говорит говорящий   www iphones ru 1371209 новости iphonesru
iPhones.ru
iPhones.ru
OpenAI выпустила три новые голосовые модели Они одновременно слушают рассуждают и переводят текст GPT Realtime 2 голосовая модель с рассуждением уровня GPT 5 для живых диалогов умеет обрабатывать сложные разговоры и естественно вести диалог GPT Realtime Translate модель перевода в реальном времени которая переводит речь с 70 языков на 13 языков учитывая темп речи говорящего GPT Realtime Whisper расшифровывает речь в режиме реального времени по мере того как говорит говорящий www iphones ru 1371209 новости iphonesru
GPT/ChatGPT/AI Central Александра Горного
GPT/ChatGPT/AI Central Александра Горного
OpenAI выпустила три голосовые модели для AI агентов GPT Realtime 2 модель способная рассуждать на уровне GPT 5 Обрабатывает сложные запросы и ведёт разговор естественно GPT Realtime Translate модель перевода в реальном времени Поддерживает 70 языков на входе и 13 на выходе GPT Realtime Whisper потоковое преобразование речи в текст openai com index advancing voice intelligence with new models in the api