21 марта, 07:48
OpenAI представила новую модель text2speech с разнообразием голосов и стилями

Нейродвиж
OpenAI выпустили новую модель text2speech для всех — ТЫК. Клонировать голос не дают, но можно прописывать их промтом, или выбирать из уже готовых вариантов. Еще из интересного — в API появились две модели speech2text распознавание речи , которые лучше Whisper.
Технологии1 день назад

NN
OpenAI запустили сайт, где можно озвучивать любой текст и создавать голоса по промту. Работает на базе новой модели GPT-4o-mini-TTS. Есть возможность настроить голос и стиль озвучки: сделать безумного ученого, рассказчика детектива или просто робота. Понимает и говорит на русском. Пробуем тут.
Технологии1 день назад


ИИшная: поговорим о технологиях
OpenAI представила новые аудиомодели Теперь голосовые агенты стали еще реалистичнее и гибче первый месяц доступ бесплатный . Новые модели OpenAI помогают создавать более естественные диалоги, улучшают распознавание речи и позволяют настраивать стиль произношения. Как это можно использовать? Голосовые ассистенты – делайте ИИ-диалоги более живыми и естественными. Озвучка контента – меняйте стиль речи под задачу: сказка, деловой тон, пиратский сленг. Клиентские сервисы – создавайте дружелюбные голосовые боты, адаптированные под аудиторию. Приложения с низкой задержкой – моментальный отклик в реальном времени через API. Что важно знать? OpenAI пока использует только предопределённые голоса, но в будущем планирует добавить возможность загружать свои кастомные варианты. Кому уже пригодился этот функционал? Пробовали в своих проектах? Делитесь опытом в комментариях!
Технологии16 часов назад

Trend Wave
OpenAI научила нейросеть говорить как угодно OpenAI.fm может озвучить текст любым голосом — достаточно описать его в запросе или выбрать из готовых вариантов. И неважно, что вам захочется, страшилку на ночь от живых мертвецов или сказку на ночь от волшебных персонажей. Попробовать можно тут.
Технологии14 часов назад


Око Технологий
Модель преобразования текста в речь от OpenAI вызывает беспокойство у актеров озвучивания. Нейросеть способна озвучивать текст выбранным голосом, учитывая пожелания пользователя по стилю произношения. Полученный голос практически неотличим от настоящего: он передает интонацию, акценты и эмоциональную окраску, звуча как профессиональный диктор. Модель можно настраивать в режиме разработчика. Сверху имеется соответствующая кнопка, нажимая на которую вы получите фрагмент кода. Если не хочется вникать в нюансы, достаточно скопировать код оттуда, вставить и попросить бота адаптировать его под ваши нужды. Бот предоставит новый код, который можно скопировать и вставить обратно в
Технологии12 часов назад




ChatGPT | Айтишная
OpenAI не отстают — Альтман выпустил ЛУЧШУЮ нейросеть для генерации озвучек Голос можно прописать в запросе или выбрать готовый. Есть очень много стилей — сказка на ночь, детектив, хоррор и т.д. Новая бомба от OpenAI — тут. Айтишная
Технологии1 день назад

GPT/ChatGPT/AI Central Александра Горного
OpenAI обновила аудиомодели Новые модели для транскрибации gpt-4o-transcribe и gpt-4o-mini-transcribe допускают меньше ошибок чем Whisper при преобразовании речи в текст. Еще они лучше работают в сложных условиях, таких как сильный акцент, шумная обстановка и переменная скорость речи. Новая модель для озвучивания текста gpt-4o-mini-tts позволяет разработчикам настраивать желаемый стиль речи. Например, можно заставить AI имитировать голос пирата. Оценить gpt-4o-mini-tts можно здесь: Новинки уже доступны через API.
Технологии15 часов назад

NEUROHUB🔥
OpenAI выпустили бесплатную модель для озвучки. Голос озвучки можно задать с помощью текстовой подсказки или выбрать из готовых вариантов, клонировать голоса пока нельзя. Зато можно выбрать стиль повествования: сказка на ночь, нуарный детектив, таксист, оптимист, ковбой и другие. Тестим OpenAI.fm
Технологии15 часов назад


AI и точка.
OpenAI представили новую модель для синтеза речи из текста. Есть детальная настройка самого голоса, интонаций, пауз, эмоций и других аспектов. Модель говорит на русском правда, часто озвучивает текст с небольшим «акцентом» . Попробовать бесплатно можно здесь. Также компания показала сразу две модели для перевода аудио в текст. Все новинки доступны через API.
Технологии15 часов назад


Маркетинг и нейросети
OpenAI выкатили в API три новые аудио-модели Первые две – speech2text. Лучше Whisper, и вообще заявляют SOTA, которые к тому же хорошо работают с акцентами, шумом и быстрой речью. Отличие между двумя – в размерах ну и цене : первая gpt-4o-transcribe, вторая – gpt-4o-mini-transcribe. Разницу в метриках и приросты оцените сами Третья моделька – gpt-4o-mini-tts – позанятнее. Это, наоборот, text2speech, то есть модель, проговаривающая текст. Но не просто проговаривающая, а с той интонацией и тем голосом, которые зададите вы. Поиграться уже можно здесь Ну и новая либа для агентов Agents SDK теперь тоже поддерживает аудио, так что с этого дня там можно создавать говорящих агентов. openai Нейросети Маркетинг
Технологии12 часов назад

Похожие новости



+7



+2



+7



+11



+8



+2

OpenAI запускает o1-pro через API по высокой цене
Технологии
1 день назад




Claude от Anthropic запускает веб-поиск для платных подписчиков в США
Технологии
13 часов назад




Правозащитники подали жалобу на OpenAI из-за ложного обвинения пользователя из Норвегии
Происшествия
1 день назад




Yandex представляет YandexART 2.5 с новыми функциями и подпиской Про
Технологии
1 день назад




Дженсен Хуанг представил новые ИИ-чипы на GTC 2025, инвесторы обеспокоены
Технологии
1 день назад




Tencent анонсировала новые ИИ-модели Hunyuan3D-2.0 для генерации 3D-контента
Технологии
22 часа назад


