6 марта, 09:22
Alibaba представила новую модель QwQ-32B, обгоняющую конкурентов в бенчмарках


эйай ньюз
QwQ 32B Новый опенсорс от команды Qwen из Alibaba не путать с QwQ-Preview, это совсем другая модель . LLM заметно обходит дистилы из R1 и даже полноценную R1 на ряде бенчей. Я немного пообщался с ней на Hyperbolic, выглядит как лучший ризонер, из тех что можно реально запустить дома. Это не самая умная модель Qwen — недавно они ещё запустили Preview QwQ Max, попробовать можно на qwen.ai. Веса финальной модели обещают выложить под Apache 2.0 вместе с Qwen 2.5 Max . Веса Блогпост
Технологии311 день назад


Хайтек+
Alibaba выпустила конкурента DeepSeek-R1, уменьшив вычислительные затраты в 60 раз Alibaba представила QwQ-32B — новую модель логических рассуждений с 32 млрд параметров, развивающую возможности предшественницы QwQ за счет обучения с подкреплением. Она обрабатывает контекст до 131 072 токенов, решает задачи по математике и коду, а также демонстрирует конкурентоспособную производительность при меньших вычислительных затратах. QwQ-32B требует всего 24 ГБ видеопамяти, тогда как аналогичный по качеству DeepSeek-R1 — более 1500 ГБ. В отличие от закрытых моделей OpenAI, новинка доступна разработчикам под лицензией Apache 2.0.
Технологии310 дней назад

Интерфакс
Qwen подразделение Alibaba выпустил ИИ-модель Модель Qwen сопоставима по качеству с R1, хотя насчитывает всего 32 млрд параметров против 671 млрд у последней активированы из них 37 млрд , отмечает компания в блоге на сайте GitHub.
Технологии310 дней назад


ForkLog FEED
Китайская компания Alibaba представила ориентированную на рассуждения ИИ-модель QwQ-32. Обладая 32 млрд параметров, она якобы способна соперничать с передовыми решениями от конкурентов вроде DeepSeek-R1, у которой показатель в 671 млрд. Компания интегрировала в нейросеть агентские возможности и критическое мышление. Производительность QwQ-32 сопоставима с моделями DeepSeek и OpenAI в ряде бенчмарков, оценивающих математические способности, навыки программирования и общие возможности решения задач. Новости AI YouTube
Технологии310 дней назад


DNS_Club
ИИ-модель Alibaba QwQ-32B демонстрирует уровень, сопоставимый с DeepSeek R1 Акции Alibaba, торгующиеся в Гонконге, выросли более чем на 8 % после анонса новой модели искусственного интеллекта QwQ-32B. Компания заявила, что модель с 32 млрд параметров может достигать производительности, сопоставимой с DeepSeek R1, содержащей 671 млрд параметров. Читать далее
Технологии310 дней назад



NN
Qwen выпустили новую «думающую» модель QwQ-32B, которая обходит топовые нейросети в некоторых бенчмарках. И она абсолютно бесплатная. Модель пишет код за несколько секунд, решает сложнейшие задачи по математике и понимает огромный контекст в 131 тыс. токенов — этого хватит, чтобы загрузить в бота целую диссертацию и задавать по ней вопросы. Тестируем в чат-боте Qwen. Надо выбрать QwQ-32B-Preview в списке моделей.
Технологии310 дней назад


AI и точка.
Qwen выпустил новую «рассуждающую» модель QwQ-32B с ноября она была в preview . По возможностям модель сопоставима с DeepSeek-R1, которая имеет 671 млрд параметров 37 млрд активных , тогда как новая QwQ — 32 млрд. Попробовать бесплатно можно на Hugging Face, скоро модель появится и в Qwen Chat. К слову, на базовой версии «обычной» Qwen-2.5-32B построена новая YandexGPT Pro 5. По сути, китайскую модель взяли за основу и провели полный цикл ее обучения на своих данных. Новая QwQ могла бы стать базой для первой российской «рассуждающей» модели, которую, по слухам, мы увидим уже в этом году.
Технологии310 дней назад

Forbes Russia
Alibaba представила новую модель искусственного интеллекта: она сопоставима по мощности с DeepSeek, но при этом задействует меньше параметров. Акции компании в Гонконге взлетели более чем на 8%. С начала года их стоимость выросла на 70% на фоне интереса инвесторов к китайскому ИИ
Технологии310 дней назад


RIDUS Новости
Китайский технологический гигант Alibaba представил в четверг свою новейшую модель генеративного искусственного интеллекта QwQ-32B, утверждая, что она превосходит конкурирующие модели от OpenAI и DeepSeek.
Технологии310 дней назад

Financial reality | Экономические Новости
Alibaba сделала нейросеть, которая работает не хуже более сложных аналогов, но требует меньше ресурсов Команда Alibaba, занимающаяся искусственным интеллектом Qwen , представила новую нейросеть QwQ-32B. По заявлению компании, она работает так же хорошо, как модель R1 от китайского стартапа DeepSeek, выпущенная в январе 2024 года. У модели Alibaba в 20 раз меньше параметров 32 млрд против 671 млрд у R1 . Параметры — это «настройки» ИИ: чем их больше, тем сложнее модель. Но разработчики уверяют, что их ИИ справляется с задачами не хуже R1, несмотря на простоту. DeepSeek заявляет, что их R1 не уступает технологиям OpenAI создатели ChatGPT , но обучение R1 обошлось всего в $6 млн. Для сравнения: компании из США тратят на обучение таких моделей миллиарды. Alibaba показала, что можно создавать мощный ИИ с меньшими затратами. Акции Alibaba резко выросли — на 8,4% за день на Гонконгской бирже. Инвесторы поверили в потенциал новой разработки. Financial Reality Экономика
Технологии310 дней назад

Похожие новости






+4






+4






+15

Новый плагин Qwen Image Edit позволяет изменять ракурсы фотографий
Технологии
15 часов назад


AgiBot стал лидером по поставкам человекоподобных роботов в 2025 году
Технологии
2 часа назад


+4
Nimble представила пауэрбанк Champ Stack 10K с возможностью деления на две части
Технологии
17 часов назад


В Юте искусственный интеллект Doctronic получил право выписывать рецепты пациентам
Наука
1 день назад


+4
Xiaomi анонсировала обновленный электроседан SU7 с увеличенным запасом хода и стартом предзаказов
Технологии
1 день назад


Сбои в работе Telegram затрудняют отправку сообщений в России
Происшествия
14 часов назад


+15