22 июля, 08:41

Qwen3-235B-A22B: Новая модель опенсорс ИИ обходит конкурентов в бенчмарках

Qwen 3 обновили  235B теперь по куче бенчей обходит Claude 4 Opus и Kimi K2. Да, релизнули только большую модель, но скоро, по идее, её должны дистиллировать это в модели помельче, так что и у простых смертных на улице будет праздник.  Модель исключительно Instruct — ризонер выпустят отдельной моделью чуть позже. Происходит это из-за того что команде Qwen слишком сложно засовывать два режима в одну модель, в результате модель работает хуже чем отдельные ризонер/инстракт модели. Тем не менее они не прекращают работать над гибридными ризонерами, так что есть шансы что эту проблему решат.  Веса
эйай ньюз
эйай ньюз
Qwen 3 обновили 235B теперь по куче бенчей обходит Claude 4 Opus и Kimi K2. Да, релизнули только большую модель, но скоро, по идее, её должны дистиллировать это в модели помельче, так что и у простых смертных на улице будет праздник. Модель исключительно Instruct — ризонер выпустят отдельной моделью чуть позже. Происходит это из-за того что команде Qwen слишком сложно засовывать два режима в одну модель, в результате модель работает хуже чем отдельные ризонер/инстракт модели. Тем не менее они не прекращают работать над гибридными ризонерами, так что есть шансы что эту проблему решат. Веса
Китайцы обновили Qwen3-235B-A22B и это теперь новая лучшая опенсорс модель   Активных параметров — 22B. По бенчам в математике и программировании показывает себя лучше, чем DeepSeek V3, Claude Opus 4 и даже Kimi K2  не долго модель была топом   . На секундочку — на ARC-AGI у нее 42%! У многих закрытых все еще ниже 40. При этом Qwen работает без ризонинга.  Тестим бесплатно тут    #КаталогНейросетей
Точка сингулярности💥
Точка сингулярности💥
Китайцы обновили Qwen3-235B-A22B и это теперь новая лучшая опенсорс модель Активных параметров — 22B. По бенчам в математике и программировании показывает себя лучше, чем DeepSeek V3, Claude Opus 4 и даже Kimi K2 не долго модель была топом . На секундочку — на ARC-AGI у нее 42%! У многих закрытых все еще ниже 40. При этом Qwen работает без ризонинга. Тестим бесплатно тут #КаталогНейросетей
Video is not supported
PROJECT+ | Нейросети
PROJECT+ | Нейросети
Вышла Qwen 3-Coder — мощнейшая open-source модель для программирования с агентными возможностями. Она уверенно держится на уровне закрытых гигантов вроде Claude 4, а в некоторых задачах даже превосходит их. Вместе с моделью выкатили полноценного ИИ-агента, который работает прямо в терминале. По сути — это альтернатива Gemini Code, только проще и дешевле. Пробуем новую имбу — здесь.
Ещё один релиз от китайцев: вышла Qwen3-Coder. Новая топовая опенсорс агентная модель для кодинга  Это MoE-модель с 480B параметров  35B активных . Контекст 256K токенов, масштабируется до 1M. Уверенно обходит Kimi K2, DeepSeek V3 и другие открытые модели на SWE-bench-Verified, WebArena и прочих бенчах.  Вместе с ней — выкатили CLI-агент Qwen Code, форк Gemini, но с нормальной реализацией prompts + function calls. Ставится через npm, работает из терминала    Тестим бесплатно здесь, Hugging Face тут, код агента тут    Bard & Gemini
Bard AI | Нейросети & IT
Bard AI | Нейросети & IT
Ещё один релиз от китайцев: вышла Qwen3-Coder. Новая топовая опенсорс агентная модель для кодинга Это MoE-модель с 480B параметров 35B активных . Контекст 256K токенов, масштабируется до 1M. Уверенно обходит Kimi K2, DeepSeek V3 и другие открытые модели на SWE-bench-Verified, WebArena и прочих бенчах. Вместе с ней — выкатили CLI-агент Qwen Code, форк Gemini, но с нормальной реализацией prompts + function calls. Ставится через npm, работает из терминала Тестим бесплатно здесь, Hugging Face тут, код агента тут Bard & Gemini
Video is not supported
Нейросети & Технологии | DeepTech
Нейросети & Технологии | DeepTech
Лучший ИИ-агент для написания кода Компания Qwen представила свою новую агентную модель Qwen 3-Coder, которая превосходит многих конкурентов, среди которых Kimi K2 и DeepSeek V3, и демонстрирует результаты лучше, чем GPT-4.1. Однако модель пока не достигла уровня Claude 4 Sonnet в определенных задачах. Протестировать это достижение можно бесплатно через чат-бот. ———————————————— - Канал про тренды из мира IT, технологий, нейросетей и бизнеса.
Loading indicator gif
Обновление Qwen3 превзошло конкурентов в бенчмарках  Обновленная модель Qwen3-235B-A22B демонстрирует впечатляющие результаты, превосходя Claude 4 Opus и Kimi K2 в тестах. Она не использует ризонинг, но при этом выдает качественные тексты и решает задачи по математике, наукам и программированию.  База обучения была расширена на всех языках, а работа с контекстом улучшена до 256 тысяч токенов, что позволяет загружать объемные тексты.  Пробуйте бесплатно тут.  ————————————————   - Канал про тренды из мира IT, технологий, нейросетей и бизнеса.
Нейросети & Технологии | DeepTech
Нейросети & Технологии | DeepTech
Обновление Qwen3 превзошло конкурентов в бенчмарках Обновленная модель Qwen3-235B-A22B демонстрирует впечатляющие результаты, превосходя Claude 4 Opus и Kimi K2 в тестах. Она не использует ризонинг, но при этом выдает качественные тексты и решает задачи по математике, наукам и программированию. База обучения была расширена на всех языках, а работа с контекстом улучшена до 256 тысяч токенов, что позволяет загружать объемные тексты. Пробуйте бесплатно тут. ———————————————— - Канал про тренды из мира IT, технологий, нейросетей и бизнеса.
Video is not supported
Bard AI | Нейросети & IT
Bard AI | Нейросети & IT
Новый лидер в опенсорс-ИИ: китайцы выкатили обновлённую Qwen3-235B-A22B Это Instruct-модель с 22 млрд активных параметров архитектура MoE . Несмотря на отсутствие reasoning-режима, она уверенно обходит Kimi K2, Claude 4 Opus и DeepSeek V3 в задачах по математике, программированию и даже показывает 42% на ARC-AGI — результат, который превосходит многие закрытые модели Тестим бесплатно здесь, Hugging Face тут
Qwen бомбят релизами: китайцы выпустили Qwen 3-Coder — это новая ЛУЧШАЯ опенсорс агентная модель для кодинга.  Моделька почти не уступает закрытому Claude 4, а кое-где и превосходит. Вместе с нейросетью опубликовали и ИИ-агента: работающего в терминале — это буквально форк Gemini Code, но дешевле.  Пробуем новую имбу — здесь.
Нейродвиж
Нейродвиж
Qwen бомбят релизами: китайцы выпустили Qwen 3-Coder — это новая ЛУЧШАЯ опенсорс агентная модель для кодинга. Моделька почти не уступает закрытому Claude 4, а кое-где и превосходит. Вместе с нейросетью опубликовали и ИИ-агента: работающего в терминале — это буквально форк Gemini Code, но дешевле. Пробуем новую имбу — здесь.
Qwen 3 Coder  Ещё один релиз от китайцев, тоже без ризонинга. На кодинг и агентных бенчах почти дотягивает до Claude 4 Sonnet. Нативно поддерживает до 256к токенов контекста, но масштабируется до миллиона с использованием YaRN.  Архитектурно это MoE на 480B параметров  35B активных , который натренировали на 7.5 триллионах токенов, 70% из них — код. Это почти в 5 раз меньше датасет чем у оригинального Qwen 3. Много внимание уделили скейлингу RL — модель учили решать реальные задачи используя реальные тулы в течении множества попыток. Чтобы это всё нормально тренировалось, они скейлили свою RL систему до 20к параллельных энвайронментов.  В официальном API у модели очень резко растёт цена с длиной контекста: до 32k контекста модель стоит $1/$5 за миллион токенов, при 128k-256k — стоит как Claude Sonnet, а при миллионе токенов контекста цена доходит до бешенных $6/$60 за миллион токенов. Так что вряд ли стоит использовать официальное API — сторонние API провайдеры хоть и дают пока лишь до 262к контекста, но там нет шанса стать на грабли бешеного прайсинга. Да и цена у сторонних провайдеров заметно ниже — самый дешёвый отдаёт модель по цене $1.5/$2 за миллион токенов.  С моделью опубликовали и Qwen Code — форк Gemini CLI, специально заточенный под Qwen Coder. Для пользователей Claude Code запустили совместимый с API Anthropic эндпоинт, но ему присущи все проблемы официального API.  С большим любопытством слежу за противостоянием открытых китайских моделей и закрытых западных. Китайцы уж очень дышат в затылок своими опенсорсными моделями.  Веса Блогпост Qwen Code
эйай ньюз
эйай ньюз
Qwen 3 Coder Ещё один релиз от китайцев, тоже без ризонинга. На кодинг и агентных бенчах почти дотягивает до Claude 4 Sonnet. Нативно поддерживает до 256к токенов контекста, но масштабируется до миллиона с использованием YaRN. Архитектурно это MoE на 480B параметров 35B активных , который натренировали на 7.5 триллионах токенов, 70% из них — код. Это почти в 5 раз меньше датасет чем у оригинального Qwen 3. Много внимание уделили скейлингу RL — модель учили решать реальные задачи используя реальные тулы в течении множества попыток. Чтобы это всё нормально тренировалось, они скейлили свою RL систему до 20к параллельных энвайронментов. В официальном API у модели очень резко растёт цена с длиной контекста: до 32k контекста модель стоит $1/$5 за миллион токенов, при 128k-256k — стоит как Claude Sonnet, а при миллионе токенов контекста цена доходит до бешенных $6/$60 за миллион токенов. Так что вряд ли стоит использовать официальное API — сторонние API провайдеры хоть и дают пока лишь до 262к контекста, но там нет шанса стать на грабли бешеного прайсинга. Да и цена у сторонних провайдеров заметно ниже — самый дешёвый отдаёт модель по цене $1.5/$2 за миллион токенов. С моделью опубликовали и Qwen Code — форк Gemini CLI, специально заточенный под Qwen Coder. Для пользователей Claude Code запустили совместимый с API Anthropic эндпоинт, но ему присущи все проблемы официального API. С большим любопытством слежу за противостоянием открытых китайских моделей и закрытых западных. Китайцы уж очень дышат в затылок своими опенсорсными моделями. Веса Блогпост Qwen Code
Video is not supported
AI и точка.
AI и точка.
Qwen3-Coder — новая лучшая open source ИИ-модель для кодинга. Всего 480 млрд параметров, 35 млрд активных. По программистским бенчмаркам обгоняет недавнюю Kimi K2, DeepSeek-V3, GPT-4.1 и даже Claude Sonnet 4. В тестах на агентность — приближается к Sonnet 4. Также компания выпустила Qwen Code — агента для кодинга, работающего в командной строке. Пообщаться с Qwen3-Coder можно бесплатно здесь. Qwen Code выложили на GitHub.
Loading indicator gif