21 марта, 07:48
OpenAI представила новую модель text2speech с разнообразием голосов и стилями

Нейродвиж
OpenAI выпустили новую модель text2speech для всех — ТЫК. Клонировать голос не дают, но можно прописывать их промтом, или выбирать из уже готовых вариантов. Еще из интересного — в API появились две модели speech2text распознавание речи , которые лучше Whisper.


ChatGPT | Айтишная
OpenAI не отстают — Альтман выпустил ЛУЧШУЮ нейросеть для генерации озвучек Голос можно прописать в запросе или выбрать готовый. Есть очень много стилей — сказка на ночь, детектив, хоррор и т.д. Новая бомба от OpenAI — тут. Айтишная

GPT/ChatGPT/AI Central Александра Горного
OpenAI обновила аудиомодели Новые модели для транскрибации gpt-4o-transcribe и gpt-4o-mini-transcribe допускают меньше ошибок чем Whisper при преобразовании речи в текст. Еще они лучше работают в сложных условиях, таких как сильный акцент, шумная обстановка и переменная скорость речи. Новая модель для озвучивания текста gpt-4o-mini-tts позволяет разработчикам настраивать желаемый стиль речи. Например, можно заставить AI имитировать голос пирата. Оценить gpt-4o-mini-tts можно здесь: Новинки уже доступны через API.

NEUROHUB🔥
OpenAI выпустили бесплатную модель для озвучки. Голос озвучки можно задать с помощью текстовой подсказки или выбрать из готовых вариантов, клонировать голоса пока нельзя. Зато можно выбрать стиль повествования: сказка на ночь, нуарный детектив, таксист, оптимист, ковбой и другие. Тестим OpenAI.fm

Trend Wave
OpenAI научила нейросеть говорить как угодно OpenAI.fm может озвучить текст любым голосом — достаточно описать его в запросе или выбрать из готовых вариантов. И неважно, что вам захочется, страшилку на ночь от живых мертвецов или сказку на ночь от волшебных персонажей. Попробовать можно тут.


Око Технологий
Модель преобразования текста в речь от OpenAI вызывает беспокойство у актеров озвучивания. Нейросеть способна озвучивать текст выбранным голосом, учитывая пожелания пользователя по стилю произношения. Полученный голос практически неотличим от настоящего: он передает интонацию, акценты и эмоциональную окраску, звуча как профессиональный диктор. Модель можно настраивать в режиме разработчика. Сверху имеется соответствующая кнопка, нажимая на которую вы получите фрагмент кода. Если не хочется вникать в нюансы, достаточно скопировать код оттуда, вставить и попросить бота адаптировать его под ваши нужды. Бот предоставит новый код, который можно скопировать и вставить обратно в


NN
OpenAI запустили сайт, где можно озвучивать любой текст и создавать голоса по промту. Работает на базе новой модели GPT-4o-mini-TTS. Есть возможность настроить голос и стиль озвучки: сделать безумного ученого, рассказчика детектива или просто робота. Понимает и говорит на русском. Пробуем тут.


ИИшная: поговорим о технологиях
OpenAI представила новые аудиомодели Теперь голосовые агенты стали еще реалистичнее и гибче первый месяц доступ бесплатный . Новые модели OpenAI помогают создавать более естественные диалоги, улучшают распознавание речи и позволяют настраивать стиль произношения. Как это можно использовать? Голосовые ассистенты – делайте ИИ-диалоги более живыми и естественными. Озвучка контента – меняйте стиль речи под задачу: сказка, деловой тон, пиратский сленг. Клиентские сервисы – создавайте дружелюбные голосовые боты, адаптированные под аудиторию. Приложения с низкой задержкой – моментальный отклик в реальном времени через API. Что важно знать? OpenAI пока использует только предопределённые голоса, но в будущем планирует добавить возможность загружать свои кастомные варианты. Кому уже пригодился этот функционал? Пробовали в своих проектах? Делитесь опытом в комментариях!


AI и точка.
OpenAI представили новую модель для синтеза речи из текста. Есть детальная настройка самого голоса, интонаций, пауз, эмоций и других аспектов. Модель говорит на русском правда, часто озвучивает текст с небольшим «акцентом» . Попробовать бесплатно можно здесь. Также компания показала сразу две модели для перевода аудио в текст. Все новинки доступны через API.


Маркетинг и нейросети
OpenAI выкатили в API три новые аудио-модели Первые две – speech2text. Лучше Whisper, и вообще заявляют SOTA, которые к тому же хорошо работают с акцентами, шумом и быстрой речью. Отличие между двумя – в размерах ну и цене : первая gpt-4o-transcribe, вторая – gpt-4o-mini-transcribe. Разницу в метриках и приросты оцените сами Третья моделька – gpt-4o-mini-tts – позанятнее. Это, наоборот, text2speech, то есть модель, проговаривающая текст. Но не просто проговаривающая, а с той интонацией и тем голосом, которые зададите вы. Поиграться уже можно здесь Ну и новая либа для агентов Agents SDK теперь тоже поддерживает аудио, так что с этого дня там можно создавать говорящих агентов. openai Нейросети Маркетинг

Похожие новости



+8






+16










OpenAI анонсировала новую модель GPT 5 5 Instant для всех пользователей ChatGPT
Технологии
1 день назад


+8
OpenAI запускает рекламную платформу ChatGPT с новыми возможностями для бизнеса
Технологии
3 часа назад


Telegram обновляет функции для улучшения работы с ботами и кастомизации контента
Технологии
18 часов назад


+16
Apple внедряет поддержку сторонних ИИ ассистентов в iOS 27
Технологии
1 день назад


Anthropic запускает режим Сновидений для самообучения ИИ агентов
Технологии
6 часов назад


Apple анонсирует возможность выбора сторонних ИИ моделей в iOS 27
Технологии
1 день назад

