10 сентября, 12:04
Alibaba представила универсальную нейросеть Qwen3 ASR для распознавания речи на русском языке


Not Boring Tech
Китайцы выпустили универсальную нейросеть для распознавания речи Qwen3 ASR работает на русском в сложных условиях и почти без ошибок Поддерживает 12 языков включая английский и русский Автоматически определяет на каком языке говорят Распознает речь даже в очень сложных условиях например когда человек поёт или неразборчиво читает рэп Word Error Rate меньше 8 Работает даже если аудио низкого качества и есть посторонние шумы Удобная фича можно загрузить особенные слова фразы и имена и нейросеть будет правильно распознавать их без дообучения Онлайн демка доступна для всех бесплатно тут notboring tech
Технологии48 дней назад


iPhones.ru
Работает на русском Alibaba представила нейросеть Qwen3 ASR для расшифровки аудиозаписей в плохом качестве По точности распознавания речи она превосходит такие модели как Gemini 2 5 Pro и GPT 4o Qwen способна расшифровывать любые аудио включая песни и некачественные записи с сильным фоновым шумом Модель поддерживает 11 языков в том числе русский и английский Qwen3 ASR Flash можно протестировать бесплатно на HuggingFace и ModelScope Разработчики также могут интегрировать её в свои сервисы Стоимость расшифровки составляет 0 000032 за секунду аудио www iphones ru iNotes rabotaet na russkom alibaba predstavila neyroset qwen3 asr dlya rasshifrovki audiozapisey v plohom kachestve новости iphonesru
Технологии47 дней назад


ИнфоИнспекция
Alibaba научила ИИ слышать сквозь шум Компания представила Qwen3 ASR модель распознавания речи которая уверенно справляется даже с записями низкого качества и фоновыми помехами Точность впечатляет коэффициент ошибок менее 8 Что в арсенале Бесплатная демоверсия и API для разработчиков Поддержка 11 языков включая русский и английский Возможность задавать ключевые слова для ещё более точной расшифровки Протестировать можно на HuggingFace и ModelScope а интеграция через API обойдётся всего в 0 000032 за секунду аудио фактически копейки за качественное распознавание Подписаться на канал
Технологии43 дня назад


Русский ИТ бизнес 👨
Qwen представили универсальную систему распознавания речи Работает только через API Qwen3 ASR Flash Поддерживаются 11 языков включая русский и китайский язык определяется автоматически а на сложном аудио вроде песен рэпа и речи с музыкой модель удерживает менее 8 процентов WER при этом нормально тянет шум низкое качество и дальний микрофон В сообществе LocalLLaMA народ хвалит качество но ворчит что доступ только через API и локально не покрутить Русский ИТ бизнес
Технологии47 дней назад


vc.ru
Alibaba представила модель Qwen3 ASR для расшифровки аудиозаписей в том числе в плохом качестве Она поддерживает русский язык Компания выложила бесплатную демоверсию и добавила модель в API vc ru ai 2207158
Технологии47 дней назад

Armenian Business Portal
ИИ продолжает оптимизацию бизнес процессов Китайский Alibaba представил модель распознавания речи Qwen3 ASR с поддержкой русского и 10 других языков Программа расшифровывает и переводит в текст в том числе низкокачественные записи речи с фоновым шумом Коэффициент ошибок меньше 8 Точность этой модели значительно превосходит аналогичные модели Gemini 2 5 Pro и GPT 4o Подобные программы позволяют оперативно превращать записи встреч и совещаний в текст без существенных временных затрат и без потери информации armbusinessportal Portal News
Технологии47 дней назад


Чёрный Треугольник
Alibaba представила ИИ Qwen3 ASR для распознавания зашумленной речи Qwen3 ASR предлагает бесплатную демоверсию и API для разработчиков обеспечивая высокую точность расшифровки речи даже в условиях низкого качества записи и фоновых шумов коэффициент ошибок составляет менее 8 Модель поддерживает 11 языков включая русский и английский и позволяет задавать ключевые слова для повышения точности записи Демоверсии доступны на платформах HuggingFace и ModelScope Что касается стоимости использование API обойдётся всего в 0 000032 за секунду аудио что делает его доступным для разработчиков желающих интегрировать качественное распознавание речи в свои проекты News Soft Gear Links
Технологии47 дней назад


Комп для чайника
Alibaba представила нейросеть для распознавания речи Корпорация Alibaba разработала модель Qwen3 ASR Flash обученную на миллионах часов аудиозаписей Система демонстрирует рекордно низкий уровень ошибок всего 3 97 для китайской речи обходя конкурентов вроде Gemini и GPT4o Модель эффективно работает с музыкой шумами и диалектами автоматически определяя язык Для точности распознавания специализированных терминов можно добавлять контекстные подсказки Qwen3 ASR Flash поддерживает 11 языков включая русский и пока доступна через демо версию и API с бесплатной квотой онлайн ИИ pcTeapot
Технологии41 день назад
Похожие новости



+1



+6



+8



+2



+1



+6

NCC Group представила систему генерации голосовых дипфейков в реальном времени
Технологии
22 часа назад


+1
Бум облачных ИИ-систем в России: рост спроса на генеративные модели и новые возможности для бизнеса
Технологии
9 часов назад


+6
Авито запускает открытые ИИ модели A Vibe и A Vision для электронной коммерции
Технологии
7 часов назад


+8
Qualcomm анонсирует новые чипы AI200 и AI250 для центров обработки данных
Технологии
4 часа назад


+2
OpenAI рассматривает монетизацию ChatGPT через таргетированную рекламу, вызывая опасения пользователей
Технологии
1 день назад


+1
Евразийский банк и Adaption Labs объединяют усилия для развития ИИ в Таджикистане
Общество
9 часов назад


+6