29 апреля, 07:01
Alibaba представила Qwen 3 — новые модели ИИ с поддержкой 119 языков


эйай ньюз
Qwen 3 — открытые гибридные ризонеры Идёт в размерах на все случаи жизни — от миниатюрной 0.6B, до огромного 235B-A22B MoE, которая обгоняет o3-mini и очень хорошо себя показывает против Gemini 2.5 Pro. Все модели — SOTA в своих весовых категориях. Особенно хочу отметить 30B-3A MoE модель — она бьёт вышедшую полтора месяца назад QwQ 32B, при в 10 раз меньшем количестве активных параметров. Она всё ещё слегка отстаёт от Qwen 3 32B, но в разы быстрее. Все эти модели — гибридные, то есть они могут вести себя и как обычная модель и как ризонер, что сильно увеличивает гибкость использования - нужно только вставить тег /no_think. Такой фичей могут похвастаться ещё только Claude 3.7 и Gemini 2.5 Flash. А ещё разработчики заявляют, что у Qwen 3 сильно улучшили тул-юз, хотя данных бенчей особо не приводят, в любом случае мы всё и так узнаем через пару дней. Но есть и ложка дёгтя — модели не мультимодальные, а мультимодальные квены обычно релизятся через 3-4 месяца . Модели тренировали на 36 триллионах токенов из 119 языков, том числе беларуского, русского и украинского. Если датасет для всех моделей одинаковый, то 0,6B тренировали на 60 тысяч токенов на один параметр привет Шиншилле . Интересно как она себя будет вести при такой плотности. Веса выложили под Apache 2.0 — то есть делать с ними можно всё что угодно. Попробовать модели можно на qwen.ai. Веса Блогпост
Технологии12 часов назад


НейроВед | Дверь в мир нейросетей
Вышла Qwen 3 Новая версия китайской нейросети поддерживает 119 языков и обходит в тестах некоторых именитых конкурентов. При этом, модель бесплатная и открытая. Смотрим тут
Технологии8 часов назад


vc.ru
Alibaba выпустила гибридную модель Qwen3 — она сама понимает, когда нужно включить режим рассуждений, а когда ответить быстро. Модель доступна бесплатно в чат-боте компании. Там она может не только писать код и тексты, но и генерировать картинки и видео vc.ru/ai/1954642
Технологии7 часов назад

БлоGнот
Alibaba представила свою новую линейку моделей искусственного интеллекта Qwen3, которая, по заявлению компании, может соперничать и даже превосходить лучшие модели Google и OpenAI. Базовые версии — это две модели MoE mixture of expert : Qwen3-235B-A22B и Qwen3-30B-A3B соответственно 235 и 30 млрд параметров всего и 22/3 млрд одновременно активны . Кроме этого, представлены 6 dense моделей с лицензией Apache: 32B, 14B, 8B, 4B, 1.7B и 0.6B параметров. Для крупнейших моделей использован рецепт, схожий с DeepSeek R1: SFT для поведения CoT, масштабный этап рассуждений RL, и традиционный RL на основе предпочтений. Остальные модели обучены путем дистилляции на данных крупных моделей. При этом модели, по аналогии с Claude, могут использовать режим рассуждений. Модели Qwen3 поддерживают 119 языков и были обучены на двух наборах данных — более 30T токенов общих данных и 5T токенов "высококачественных" данных. Самая крупная модель, Qwen-3-235B-A22B, немного превосходит OpenAI o3-mini и Google Gemini 2.5 Pro в соревнованиях по программированию Codeforces, а также превосходит o3-mini в сложных математических тестах AIME. Однако эта модель пока не доступна публично. Впрочем, рядовому пользователю это немного все равно, запустить её локально все равно не выйдет. Правда, модели пока не мультимодальные. Теперь все ждем сегодняшних анонсов Meta на LlamaCon — возможно, там тоже покажут "рассуждающую" Llama и немного вернут её в фокус внимания сообщества.
Технологии6 часов назад


CIO: канал IT руководителей
Вышла Qwen3 // Хабр Новое семейство Qwen3 представлено в виде Dense: 0.6B,1.7B, 4B, 8B, 14B, 32B, и в виде MoE: 30B-A3B, 235B-A22B. Каждая модель поддерживать гибридный режим работы: обычный и размышление. Поддерживает 119 языков и диалектов. По результатам тестирований, Qwen3 обходит LLama4 402B Maverick и вполне успешно конкурирует с DeepSeek R1.
Технологии4 часа назад




NN
Вышла Qwen 3 — флагманская линейка моделей от Alibaba. По ряду бенчмарков они не уступают или даже обгоняют OpenAI o3-mini. Модели отлично показывают себя в программировании, могут отвечать как обычный чат-бот или как ризонер. Длина контекста — от 32 тыс. до 128 тыс. токенов. Есть поддержка 119 языков, включая русский. Пробуем здесь.
Технологии9 часов назад


Rozetked
Новый день — новые ИИ-модели из Китая Alibaba выпустила Qwen 3 — новое семейство ИИ-моделей под открытой лицензией. Сообщается, что флагманская Qwen3-235B-A22B сопоставима с DeepSeek-R1, o1, o3-mini, Grok-3 и Gemini-2.5-Pro. Большинство моделей Qwen 3 уже доступны или скоро появятся для загрузки под открытой лицензией на платформах Hugging Face и GitHub. ИИ-модели семейства также доступны в веб-версии и в приложении. rozetked.me/news/38932
Технологии9 часов назад

Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Прямо перед конфой Meta , Alibaba выпускает 8 моделей Qwen3, и они соревнуются с лучшими моделями от OpenAI и DeepSeek Состав релиза тут. Все модели доступны также в квантизированных вариантах. Объём данных и обучение-более 30 трлн токенов общих данных и 5 трлн токенов "высококачественных" данных. Это больше, чем весь бюджет обучения OLMo в Ai2. Несмотря на отличные показатели в тестах, модели могут быть не так устойчивы, как лучшие модели на рынке. Qwen 3 явно ориентируется на DeepSeek как на основного конкурента среди открытых моделей и показывает похожие черты с R1, например, начало цепочек рассуждений со слова "Okay". Qwen3 изначально не мультимодальная, что может быть недостатком по сравнению с Llama 4 и тенденцией к более ранней интеграции, как у GPT-4o. 4B-модель Qwen оказывается в одной таблице результатов с GPT-4 - это достижение. Режим рассуждений Qwen похож на механизмы, используемые в моделях Claude 3.7 и Grok 3. запрещенная в РФ организация.
Технологии7 часов назад

Политика Онлайн
Alibaba продолжает активно развивать технологии искусственного интеллекта, и запуск Qwen 3 — это значительный шаг вперед. Способность модели «думать» перед выдачей ответа открывает новые горизонты в области взаимодействия человека и машины. Это даст возможность пользователям получать более точные и взвешенные ответы, что крайне важно в различных сферах — от образования до бизнеса. Разнообразие версий с различным количеством параметров делает Qwen 3 доступной для широкой аудитории. Возможность запускать упрощенные версии локально на домашнем ПК — это отличный плюс для разработчиков и энтузиастов, которые хотят экспериментировать с ИИ без необходимости инвестировать в дорогостоящее оборудование или облачные услуги. Поддержка 100 языков, включая русский, также делает модель более универсальной и расширяет её аудиторию. То, что она предлагается совершенно бесплатно, может значительно ускорить её внедрение в различные проекты и повысить интерес к использованию ИИ в повседневной жизни. В целом, Qwen 3 от Alibaba демонстрирует, что компания продолжает оставаться на передовой ИИ-технологий, предоставляя доступные и мощные инструменты для разработчиков и пользователей по всему миру.
Технологии6 часов назад

Чёрный Треугольник
Alibaba представила модель Qwen 3 Компания Alibaba утверждает, что её новая модель Qwen 3 обходит o3-mini OpenAI благодаря использованию гибридных моделей, которые автоматически активируют режим рассуждений при кодировании и быстро реагируют на простые запросы. В тестах Qwen3-235B-A22B продемонстрировала выдающиеся результаты в программировании и математике, хотя и уступила Google Gemini 2.5 Pro Модель интегрирована в бесплатный чат-бот Qwen Chat, доступный в России и Беларуси, и предлагает функции анализа документов, а также генерацию изображений и видео. Картинки создаются за считанные секунды, а видео — всего за пять минут. Разработчики могут получить доступ к открытым исходным кодам моделей на платформах Hugging Face и GitHub, а Qwen3 поддерживает 119 языков и диалектов. ================ News Soft Gear Links
Технологии5 часов назад

Похожие новости



+10



+4



+8



+5



+37



+6

Alibaba запускает новые языковые модели Qwen3 с открытым исходным кодом
Технологии
8 часов назад




OpenAI реагирует на критику ChatGPT за чрезмерное одобрение странных идей пользователей
Технологии
21 час назад




OpenAI запускает функцию покупок в ChatGPT с персонализированными рекомендациями
Технологии
6 часов назад




YouTube тестирует новую функцию ИИ для оптимизации поиска видео
Технологии
1 день назад




«Яндекс» запускает проект по разработке гуманоидных роботов с поддержкой нового фонда
Технологии
10 часов назад




Круглый стол в Мособлизбиркоме: Искусственный интеллект как инструмент для выборов
Общество
2 часа назад


