12 сентября, 12:59
Alibaba представляет Qwen3 Next: новая ИИ модель с улучшенной эффективностью


AI и точка.
Alibaba выпустили гибридную модель нового поколения Qwen3 Next Содержит 80 млрд параметров но всего 3 млрд активируются при запросе В обычном режиме результат плюс минус как у большой модели Qwen3 на 235B параметров в рассуждающем чуть лучше Gemini 2 5 Flash Thinking и других рассуждающих моделей компании Но суть не в приростах по бенчмаркам а в новой оптимизированной архитектуре Qwen3 Next обходит Qwen3 32B при этом модель потребовала в 10 раз меньше ресурсов на обучение и показывает в 10 раз большую эффективность работы Попробовать можно бесплатно в Qwen Chat
Технологии46 дней назад


iPhones.ru
Alibaba представила свою лучшую ИИ модель с рассуждением Qwen3 Next В тестах она показала результаты лучше чем все предыдущие модели Qwen и Gemini 2 5 Flash Qwen3 Next доступна всем пользователям бесплатно в чат боте Qwen Компания новости iphonesru
Технологии45 дней назад

![Data Science | Machinelearning [ru]](https://content.tek.fm/c7b033c0-719e-4f7e-a4c1-0bb683bf6a57.jpg)
Data Science | Machinelearning [ru]
Qwen3 Next Новая модель от Alibaba мощь цена и скорость в одном флаконе Alibaba представила новое поколение своих языковых моделей Qwen3 Next которое обещает сочетание мощности крупных моделей с ценой и скоростью средних В линейке доступны три версии Base для исследований и дообучения Instruct основная версия для приложений и общения Thinking для задач требующих пошагового рассуждения например в математике или логике Что нового в Qwen3 Next Qwen3 Next использует уникальную архитектуру mixture of experts из 80 миллиардов параметров модель задействует лишь 3 миллиарда выбирая нужных специалистов под задачу Это позволяет значительно ускорить работу без потери качества Кроме того модель поддерживает работу с очень длинными документами до 262 тысяч токенов из коробки и до 1 миллиона токенов в специальном режиме По заявлению разработчиков обучение модели обходится в 10 раз дешевле чем у предыдущей версии Qwen3 32B а её пропускная способность на длинных контекстах увеличена более чем в 10 раз Уровень производительности сопоставим с Gemini 2 5 Flash и Qwen3 235B но при этом запуск требует меньших ресурсов Открытая лицензия Apache 2 0 доступ через Hugging Face Подходит для работы с движками SGLang и vLLM поддерживающими как длинный контекст так и ускоренные режимы генерации Как вам такие решения от китайцев Data Science
Технологии45 дней назад


Unlim AI
Alibaba представила Qwen3 Next новую ИИ модель с улучшенными характеристиками Alibaba анонсировала модель искусственного интеллекта Qwen3 Next которая в 10 раз быстрее предыдущей версии Qwen3 32B и требует в 10 раз меньше затрат на обучение Обладая 80 млрд параметров Qwen3 Next сравнима по качеству ответов с флагманской моделью Qwen3 235B A22B Основные новшества Эффективная обработка данных благодаря гибридному вниманию и архитектуре высокоразреженной смеси экспертов MoE Поддержка многотокенного прогнозирования для повышения стабильности во время обучения Qwen3 Next доступна через API в инфраструктуре Alibaba Cloud и на платформе Hugging Face Более подробная информация доступна по ссылке Unlim AI
Технологии45 дней назад


vc.ru
Alibaba добавила в бесплатный чат бот Qwen модель Qwen3 Next на 80 млрд параметров Её рассуждающая версия превосходит Gemini 2 5 в тестах на написание кода математику и общие знания заявляет компания Веса Qwen3 Next выложили на HuggingFace vc ru ai 2211957
Технологии45 дней назад


iGuides.ru
Alibaba представила ИИ модель Qwen3 Next которая умнее Google Gemini Китайская Alibaba выпустила Qwen3 Next ИИ модель нового поколения которая стала важным шагом в развитии экосистемы Qwen Новинка отличается от предыдущих наработок десятикратным ростом мощности и при этом требует в 10 раз меньше затрат на обучение Исходный код модели опубликован на GitHub и Hugging Face что позволяет сторонним разработчикам использовать и дорабатывать её под свои задачи Ключевой архитектурой Qwen3 Next стала система MoE которая делит модель на специализированные подсети для повышения эффективности Дополнительно внедрены технологии гибридного внимания и многотокенного прогнозирования позволяющие ускорить обработку длинных текстов и повысить стабильность обучения Alibaba заявляет что Qwen3 Next 80B A3B с 80 млрд параметров не только быстрее предшественников но и по ряду задач сопоставима с флагманской моделью Qwen3 235B Также компания выделяет версию Qwen3 Next Thinking которая превзошла Google Gemini 2 5 Flash Thinking и предыдущие модели Alibaba в тестах производительности Добивает всё это комбо поддержка MLX фреймворка Apple что даёт возможность запускать Qwen3 на iPhone и других девайсов компании iguides
Технологии45 дней назад
Похожие новости






+6



+2



+8



+2



+6

Представлена MiniMax M2: новая открытая языковая модель с 230 миллиардов параметров
Технологии
9 часов назад


Бум облачных ИИ-систем в России: рост спроса на генеративные модели и новые возможности для бизнеса
Технологии
9 часов назад


+6
Qualcomm анонсирует новые чипы AI200 и AI250 для центров обработки данных
Технологии
4 часа назад


+2
Авито запускает открытые ИИ модели A Vibe и A Vision для электронной коммерции
Технологии
7 часов назад


+8
Китайская нейронка DeepSeek демонстрирует рекордный рост на крипторынке
Экономика
6 часов назад


+2
Евразийский банк и Adaption Labs объединяют усилия для развития ИИ в Таджикистане
Общество
9 часов назад


+6