28 августа, 18:07
OpenAI представила новую голосовую модель GPT Realtime для обработки речи в реальном времени

Denis Sexy IT 🤖
Показали новую модель для голоса gpt realtime она натренирована понимать речь не переводя ее в текст а сразу нативно обрабатывать аудио Модель умеет в эмоции в акценты в много языков принимает на входе картинки и все это в режиме реального времени играться можно в кабинете API OpenAI в разделе audio
Технологии5 часов назад

Чёрный Треугольник
OpenAI выпустила gpt realtime для создания высококачественных голосовых агентов Модель отличается высоким качеством речи естественным звучанием и способностью следовать сложным инструкциям Ключевые возможности gpt realtime включают интеллектуальное понимание аудио и реализацию невербальных сигналов например смех а также два новых голоса с улучшенным качеством звучания API обрабатывает аудио через одну модель не переводя в текст и обратно что значительно снижает задержку Модель хорошо имитирует живые эмоции и понимает десятки языков включая русский OpenAI заявляет что внедрила меры безопасности для предотвращения злоупотреблений News Soft Gear Links
Технологии5 часов назад

Postium: интернет-медиа
OpenAI научила нейронку ПОНИМАТЬ человеческую речь OpenAI представила новую голосовую модель gpt realtime Она обрабатывает речь сразу звук на вход звук на выход без промежуточного текста Это значит меньше задержек больше естественных эмоций и реалистичный диалог с ИИ Что умеет Понимает десятки языков включая русский Говорит с эмоциями и паузами Можно настроить стиль например говори медленно и вежливо Работает в звонках и с картинками Поддерживает SIP и внешний инструменты Доступна разработчикам через Realtime API для создания голосовых помощников репетиторов ботов и т д В ChatGPT пока не встроена
Технологии2 часа назад


NN
OpenAI выпустили новую голосовую модель gpt realtime распознает речь на ходу без перевода в текст Модель хорошо имитирует живые эмоции и понимает десятки языков включая русский Ее можно превратить в личного репетитора по иностранному который поможет тренировать произношение Пробуем бесплатно здесь Достаточно войти в свой аккаунт от ChatGPT
Технологии5 часов назад


Data Secrets
OpenAI релизнули новую speech2speech модель gpt realtime и наконец сделали Realtime API общедоступным Так по порядку 1 gpt realtime это модель специально для реализации всевозможных голосовых помощников и ботов Ей прокачали следование инструкциям разработчиков задержку естественность речи и даже вызов инструментов Получается ультимативный голосовой бот который говорит как живой консультант при необходимости ходит в базу знаний и не отступает от намеченных правил 2 Модель два дополнительных голоса послушать будут с этого дня доступны в Realtime API которое наконец то вышло из беты Туда добавили MCP возможность инпута картинками и несколько других интересных плюшек Подробности Цены кстати снизили на 20 по сравнению с превью версией а метрики при этом подросли Подробный прайсинг Потестить можно тут в песочнице
Технологии4 часа назад
Похожие новости



+13



+1





+3






+1

Яндекс представил YandexGPT 5.1 Pro для автоматизации бизнес-процессов
Технологии
11 часов назад




Сравнение нейросетей GigaChat и Алиса: кто лучше справляется с задачами
Технологии
1 день назад




ПСБ запускает ИИ-ассистента 'Катюша' с технологией RAG для бизнес-клиентов
Технологии
9 часов назад


Технологические новшества и финансовые достижения: от ИИ до солнечных панелей
Технологии
1 день назад




OpenAI и Anthropic проводят совместное тестирование моделей ИИ для повышения безопасности
Технологии
7 часов назад



Sync Labs представляет Lipsync 2 Pro: новая ИИ модель для синхронизации губ с поддержкой 4K
Технологии
1 день назад


