28 августа, 18:07
OpenAI представила новую голосовую модель GPT Realtime для обработки речи в реальном времени

Denis Sexy IT 🤖
Показали новую модель для голоса gpt realtime она натренирована понимать речь не переводя ее в текст а сразу нативно обрабатывать аудио Модель умеет в эмоции в акценты в много языков принимает на входе картинки и все это в режиме реального времени играться можно в кабинете API OpenAI в разделе audio

Чёрный Треугольник
OpenAI выпустила gpt realtime для создания высококачественных голосовых агентов Модель отличается высоким качеством речи естественным звучанием и способностью следовать сложным инструкциям Ключевые возможности gpt realtime включают интеллектуальное понимание аудио и реализацию невербальных сигналов например смех а также два новых голоса с улучшенным качеством звучания API обрабатывает аудио через одну модель не переводя в текст и обратно что значительно снижает задержку Модель хорошо имитирует живые эмоции и понимает десятки языков включая русский OpenAI заявляет что внедрила меры безопасности для предотвращения злоупотреблений News Soft Gear Links

Postium: интернет-медиа
OpenAI научила нейронку ПОНИМАТЬ человеческую речь OpenAI представила новую голосовую модель gpt realtime Она обрабатывает речь сразу звук на вход звук на выход без промежуточного текста Это значит меньше задержек больше естественных эмоций и реалистичный диалог с ИИ Что умеет Понимает десятки языков включая русский Говорит с эмоциями и паузами Можно настроить стиль например говори медленно и вежливо Работает в звонках и с картинками Поддерживает SIP и внешний инструменты Доступна разработчикам через Realtime API для создания голосовых помощников репетиторов ботов и т д В ChatGPT пока не встроена


PRO AI | ПОЛЕЗНЫЙ СОФТ | НОВОСТИ
OpenAI представила новую модель речи gpt realtime ориентированную на естественное произношение и следование инструкциям Эта разработка нацелена на привлечение предприятий к использованию AI генерируемых голосов в приложениях Ожидается что более естественные голоса помогут увеличить внедрение технологий искусственного интеллекта в бизнесе PRO AI OFFICIAL

Ринат Шакиров | Промпты для Midjourney | ChatGPT
ИИ который отвечает быстрее человека OpenAI представила GPT Realtime OpenAI запустила GPT Realtime новый инструмент для мгновенных разговоров с искусственным интеллектом Теперь общение с ИИ становится максимально живым и быстрым Что это значит Ответ от ИИ приходит за доли секунды примерно 232 мс почти как в обычном диалоге Можно говорить голосом перебивать его и получать естественную реакцию как с человеком Поддерживает голос текст и даже видео всё в одном потоке общения Работает через современные технологии WebRTC и WebSocket что облегчает подключение к приложениям Основан на GPT 4o mini модели которая быстрее и дешевле обычных аналогов Иными словами это шаг к тому чтобы ИИ можно было использовать как настоящего собеседника для звонков чат ботов или любых приложений в реальном времени Подробнее тут сервисы dailyprompts



NN
OpenAI выпустили новую голосовую модель gpt realtime распознает речь на ходу без перевода в текст Модель хорошо имитирует живые эмоции и понимает десятки языков включая русский Ее можно превратить в личного репетитора по иностранному который поможет тренировать произношение Пробуем бесплатно здесь Достаточно войти в свой аккаунт от ChatGPT


Data Secrets
OpenAI релизнули новую speech2speech модель gpt realtime и наконец сделали Realtime API общедоступным Так по порядку 1 gpt realtime это модель специально для реализации всевозможных голосовых помощников и ботов Ей прокачали следование инструкциям разработчиков задержку естественность речи и даже вызов инструментов Получается ультимативный голосовой бот который говорит как живой консультант при необходимости ходит в базу знаний и не отступает от намеченных правил 2 Модель два дополнительных голоса послушать будут с этого дня доступны в Realtime API которое наконец то вышло из беты Туда добавили MCP возможность инпута картинками и несколько других интересных плюшек Подробности Цены кстати снизили на 20 по сравнению с превью версией а метрики при этом подросли Подробный прайсинг Потестить можно тут в песочнице

GPT/ChatGPT/AI Central Александра Горного
OpenAI выпустила Realtime API и новую голосовую модель Realtime API теперь доступен для всех разработчиков С его помощью делать голосовых агентов API поддерживает MCP загрузку изображений и звонки по протоколу SIP Еще в Realtime API появилось два новых голоса Также вышла gpt realtime самая продвинутая модель OpenAI для распознавания речи В компании говорят что она лучше следует командам разработчиков и выполняет сложные инструкции Попробовать gpt realtime можно тут если у вас добавлен способ оплаты platform openai com audio realtime


PROJECT+ | Нейросети
OpenAI выкатили gpt realtime голосовую модель формата речь в речь Она обрабатывает аудио напрямую без промежуточной транскрибации в текст поэтому отвечает быстрее и звучит естественнее понимает десятки языков включая русский и умеет варьировать интонацию Где полезно личный тренер произношения живой голосовой ассистент задачки с инструментами по команде модель уверенно держит сложные инструкции Пробуем тут нужен вход в аккаунт Service Подписаться


CIO: канал IT руководителей
OpenAI представила новый голосовой ИИ Хабр OpenAI провела презентацию Realtime API обновленной платформы для создания голосовых приложений Ключевым апдейтом API стала gpt realtime новая speech to speech модель специально обученная понимать речь не переводя ее в текст Благодаря такому подходу голосовой ассистент быстрее отвечает и реже перебивает пользователя Также новинка понимает интонацию пользователя распознает разные эмоции смех грусть и сама имитирует их Модель многоязыковая и способна переключаться между языками на ходу В ходе демонстрации OpenAI показали несколько сценариев В одном модель рассказала стих с интонацией на ходу переключаясь между несколькими языками В другом сыграла роль голосового ассистента техподдержки вежливо отвечая слишком настойчивому клиенту

Похожие новости









+1



+27



+4



+2

Дуров анонсирует обновление опросов в Telegram для повышения достоверности результатов
Политика
1 день назад


Опрос Gartner: Внедрение ИИ не привело к росту рентабельности у 80 компаний
Экономика
8 часов назад


Завершение производства Tesla Model S и X: последние автомобили сошли с конвейера
Технологии
18 часов назад


+1
Минздрав РФ внедряет ИИ для снижения нагрузки на медиков
Наука
17 часов назад


+27
Олег Кузовков анонсирует полнометражный фильм по франшизе 'Маша и Медведь'
Общество
12 часов назад


+4
Мошенники используют поддельные CAPTCHA для кражи данных пользователей
Происшествия
12 часов назад


+2