21 марта, 07:48

OpenAI представила новую модель text2speech с разнообразием голосов и стилями

Нейродвиж
Нейродвиж
OpenAI выпустили новую модель text2speech для всех — ТЫК. Клонировать голос не дают, но можно прописывать их промтом, или выбирать из уже готовых вариантов. Еще из интересного — в API появились две модели speech2text распознавание речи , которые лучше Whisper.
NN
NN
OpenAI запустили сайт, где можно озвучивать любой текст и создавать голоса по промту. Работает на базе новой модели GPT-4o-mini-TTS. Есть возможность настроить голос и стиль озвучки: сделать безумного ученого, рассказчика детектива или просто робота. Понимает и говорит на русском. Пробуем тут.
OpenAI представила новые аудиомодели  Теперь голосовые агенты стали еще реалистичнее и гибче  первый месяц доступ бесплатный . Новые модели OpenAI помогают создавать более естественные диалоги, улучшают распознавание речи и позволяют настраивать стиль произношения.     Как это можно использовать?   Голосовые ассистенты – делайте ИИ-диалоги более живыми и естественными.   Озвучка контента – меняйте стиль речи под задачу: сказка, деловой тон, пиратский сленг.   Клиентские сервисы – создавайте дружелюбные голосовые боты, адаптированные под аудиторию.   Приложения с низкой задержкой – моментальный отклик в реальном времени через API.    Что важно знать? OpenAI пока использует только предопределённые голоса, но в будущем планирует добавить возможность загружать свои кастомные варианты.    Кому уже пригодился этот функционал? Пробовали в своих проектах? Делитесь опытом в комментариях!
ИИшная: поговорим о технологиях
ИИшная: поговорим о технологиях
OpenAI представила новые аудиомодели Теперь голосовые агенты стали еще реалистичнее и гибче первый месяц доступ бесплатный . Новые модели OpenAI помогают создавать более естественные диалоги, улучшают распознавание речи и позволяют настраивать стиль произношения. Как это можно использовать? Голосовые ассистенты – делайте ИИ-диалоги более живыми и естественными. Озвучка контента – меняйте стиль речи под задачу: сказка, деловой тон, пиратский сленг. Клиентские сервисы – создавайте дружелюбные голосовые боты, адаптированные под аудиторию. Приложения с низкой задержкой – моментальный отклик в реальном времени через API. Что важно знать? OpenAI пока использует только предопределённые голоса, но в будущем планирует добавить возможность загружать свои кастомные варианты. Кому уже пригодился этот функционал? Пробовали в своих проектах? Делитесь опытом в комментариях!
Trend Wave
Trend Wave
OpenAI научила нейросеть говорить как угодно OpenAI.fm может озвучить текст любым голосом — достаточно описать его в запросе или выбрать из готовых вариантов. И неважно, что вам захочется, страшилку на ночь от живых мертвецов или сказку на ночь от волшебных персонажей. Попробовать можно тут.
Модель преобразования текста в речь от OpenAI вызывает беспокойство у актеров озвучивания. Нейросеть способна озвучивать текст выбранным голосом, учитывая пожелания пользователя по стилю произношения. Полученный голос практически неотличим от настоящего: он передает интонацию, акценты и эмоциональную окраску, звуча как профессиональный диктор.  Модель можно настраивать в режиме разработчика. Сверху имеется соответствующая кнопка, нажимая на которую вы получите фрагмент кода. Если не хочется вникать в нюансы, достаточно скопировать код оттуда, вставить и попросить бота адаптировать его под ваши нужды. Бот предоставит новый код, который можно скопировать и вставить обратно в
Око Технологий
Око Технологий
Модель преобразования текста в речь от OpenAI вызывает беспокойство у актеров озвучивания. Нейросеть способна озвучивать текст выбранным голосом, учитывая пожелания пользователя по стилю произношения. Полученный голос практически неотличим от настоящего: он передает интонацию, акценты и эмоциональную окраску, звуча как профессиональный диктор. Модель можно настраивать в режиме разработчика. Сверху имеется соответствующая кнопка, нажимая на которую вы получите фрагмент кода. Если не хочется вникать в нюансы, достаточно скопировать код оттуда, вставить и попросить бота адаптировать его под ваши нужды. Бот предоставит новый код, который можно скопировать и вставить обратно в
Loading indicator gif
Текущий курс криптовалюты и не только
Tokengram.ru
Tokengram.ru
Текущий курс криптовалюты и не только
OpenAI не отстают — Альтман выпустил ЛУЧШУЮ нейросеть для генерации озвучек   Голос можно прописать в запросе или выбрать готовый. Есть очень много стилей — сказка на ночь, детектив, хоррор и т.д.  Новая бомба от OpenAI — тут.    Айтишная
ChatGPT | Айтишная
ChatGPT | Айтишная
OpenAI не отстают — Альтман выпустил ЛУЧШУЮ нейросеть для генерации озвучек Голос можно прописать в запросе или выбрать готовый. Есть очень много стилей — сказка на ночь, детектив, хоррор и т.д. Новая бомба от OpenAI — тут. Айтишная
GPT/ChatGPT/AI Central Александра Горного
GPT/ChatGPT/AI Central Александра Горного
OpenAI обновила аудиомодели Новые модели для транскрибации gpt-4o-transcribe и gpt-4o-mini-transcribe допускают меньше ошибок чем Whisper при преобразовании речи в текст. Еще они лучше работают в сложных условиях, таких как сильный акцент, шумная обстановка и переменная скорость речи. Новая модель для озвучивания текста gpt-4o-mini-tts позволяет разработчикам настраивать желаемый стиль речи. Например, можно заставить AI имитировать голос пирата. Оценить gpt-4o-mini-tts можно здесь: Новинки уже доступны через API.
NEUROHUB🔥
NEUROHUB🔥
OpenAI выпустили бесплатную модель для озвучки. Голос озвучки можно задать с помощью текстовой подсказки или выбрать из готовых вариантов, клонировать голоса пока нельзя. Зато можно выбрать стиль повествования: сказка на ночь, нуарный детектив, таксист, оптимист, ковбой и другие. Тестим OpenAI.fm
OpenAI представили новую модель для синтеза речи из текста. Есть детальная настройка самого голоса, интонаций, пауз, эмоций и других аспектов. Модель говорит на русском  правда, часто озвучивает текст с небольшим «акцентом» .  Попробовать бесплатно можно здесь.  Также компания показала сразу две модели для перевода аудио в текст. Все новинки доступны через API.
AI и точка.
AI и точка.
OpenAI представили новую модель для синтеза речи из текста. Есть детальная настройка самого голоса, интонаций, пауз, эмоций и других аспектов. Модель говорит на русском правда, часто озвучивает текст с небольшим «акцентом» . Попробовать бесплатно можно здесь. Также компания показала сразу две модели для перевода аудио в текст. Все новинки доступны через API.
OpenAI выкатили в API три новые аудио-модели     Первые две – speech2text. Лучше Whisper, и вообще заявляют SOTA, которые к тому же хорошо работают с акцентами, шумом и быстрой речью.   Отличие между двумя – в размерах  ну и цене : первая gpt-4o-transcribe, вторая – gpt-4o-mini-transcribe. Разницу в метриках и приросты оцените сами       Третья моделька – gpt-4o-mini-tts – позанятнее. Это, наоборот, text2speech, то есть модель, проговаривающая текст. Но не просто проговаривающая, а с той интонацией и тем голосом, которые зададите вы. Поиграться уже можно здесь     Ну и новая либа для агентов Agents SDK теперь тоже поддерживает аудио, так что с этого дня там можно создавать говорящих агентов.   openai  Нейросети   Маркетинг
Маркетинг и нейросети
Маркетинг и нейросети
OpenAI выкатили в API три новые аудио-модели Первые две – speech2text. Лучше Whisper, и вообще заявляют SOTA, которые к тому же хорошо работают с акцентами, шумом и быстрой речью. Отличие между двумя – в размерах ну и цене : первая gpt-4o-transcribe, вторая – gpt-4o-mini-transcribe. Разницу в метриках и приросты оцените сами Третья моделька – gpt-4o-mini-tts – позанятнее. Это, наоборот, text2speech, то есть модель, проговаривающая текст. Но не просто проговаривающая, а с той интонацией и тем голосом, которые зададите вы. Поиграться уже можно здесь Ну и новая либа для агентов Agents SDK теперь тоже поддерживает аудио, так что с этого дня там можно создавать говорящих агентов. openai Нейросети Маркетинг
Loading indicator gif