OpenAI представила новые голосовые модели для улучшения диалогов и перевода в реальном времени

Подготовлено редакцией Tek.fmДайджест Telegram-каналов

Редакционное саммари

OpenAI анонсировала выпуск трех новых голосовых моделей, предназначенных для улучшения взаимодействия с искусственным интеллектом. Эти модели, доступные через Realtime API, способны обрабатывать сложные диалоги, переводить речь в реальном времени и транскрибировать аудио. Первая модель, GPT Realtime 2, демонстрирует уровень рассуждений, сопоставимый с GPT 5, и может удерживать контекст на протяжении длительных разговоров благодаря увеличенному контекстному окну до 128 тысяч токенов. Это позволяет моделям более естественно вести диалоги, включая возможность перебивать себя и вызывать инструменты для решения задач в процессе общения. Вторая модель, GPT Realtime Translate, обеспечивает потоковый перевод с 70 языков на 13, учитывая темп речи говорящего. Третья модель, GPT Realtime Whisper, предназначена для транскрибации речи в режиме реального времени, что может быть полезно для создания субтитров и заметок. Эти инновации могут значительно изменить подход к взаимодействию с AI, улучшая качество общения и расширяя возможности использования технологий в различных сферах, таких как образование, бизнес и развлечения. Внедрение таких моделей может привести к более эффективным и интуитивным интерфейсам, что, в свою очередь, повысит доступность информации и упростит коммуникацию между людьми и машинами.

Machinelearning

Еще OpenAI выкатила GPT Realtime 2 голосовую модель нового поколения для API Api позволяет делать realtime собеседников которые могут слушать рассуждать перебивать себя по ходу диалога вызывать инструменты и решать задачи прямо во время разговора Что вышло GPT Realtime 2 модель для production voice agents с reasoning уровня GPT 5 обработкой перебиваний tool calls и более живым диалогом GPT Realtime Translate потоковый перевод в реальном времени более 70 входных языков и 13 выходных GPT Realtime Whisper потоковая транскрибация речи для субтитров заметок и live конспектов openai com index advancing voice intelligence with new models in the api ai machinelearning big data

Технологии15 часов назад

vc.ru

OpenAI представила три аудиомодели для ИИ агентов Одна умеет рассуждать на уровне GPT 5 и лучше предшественницы удерживает контекст контекстное окно увеличили до 128 тысяч токенов Другие две предназначены для синхронных переводов и расшифровок Все три доступны в Realtime API vc ru ai 2915334 На видео пример как работает модель для перевода

Технологии14 часов назад

OpenAI выпустила три новые голосовые модели Они одновременно слушают рассуждают и переводят текст GPT Realtime 2 голосовая модель с рассуждением уровня GPT 5 для живых диалогов умеет обрабатывать сложные разговоры и естественно вести диалог GPT Realtime Translate модель перевода в реальном времени которая переводит речь с 70 языков на 13 языков учитывая темп речи говорящего GPT Realtime Whisper расшифровывает речь в режиме реального времени по мере того как говорит говорящий www iphones ru 1371209 новости iphonesru

iPhones.ru

OpenAI выпустила три новые голосовые модели Они одновременно слушают рассуждают и переводят текст GPT Realtime 2 голосовая модель с рассуждением уровня GPT 5 для живых диалогов умеет обрабатывать сложные разговоры и естественно вести диалог GPT Realtime Translate модель перевода в реальном времени которая переводит речь с 70 языков на 13 языков учитывая темп речи говорящего GPT Realtime Whisper расшифровывает речь в режиме реального времени по мере того как говорит говорящий www iphones ru 1371209 новости iphonesru

Технологии14 часов назад

GPT/ChatGPT/AI Central Александра Горного

OpenAI выпустила три голосовые модели для AI агентов GPT Realtime 2 модель способная рассуждать на уровне GPT 5 Обрабатывает сложные запросы и ведёт разговор естественно GPT Realtime Translate модель перевода в реальном времени Поддерживает 70 языков на входе и 13 на выходе GPT Realtime Whisper потоковое преобразование речи в текст openai com index advancing voice intelligence with new models in the api

Технологии3 часа назад

OpenAI представила новые голосовые модели для улучшения диалогов и перевода в реальном времени

Редакционное саммари

Источники

OpenAI запускает рекламную платформу ChatGPT с новыми возможностями для бизнеса

Apple внедряет поддержку сторонних ИИ ассистентов в iOS 27

Apple анонсирует возможность выбора сторонних ИИ моделей в iOS 27

Anthropic запускает режим Сновидений для самообучения ИИ агентов

Telegram обновляет функции для улучшения работы с ботами и кастомизации контента

Шивон Зилис подтвердила связь с Илоном Маском в суде по делу против Сэма Альтмана