Qwen3-235B-A22B: Новая модель опенсорс ИИ обходит конкурентов в бенчмарках

эйай ньюз

Qwen 3 обновили 235B теперь по куче бенчей обходит Claude 4 Opus и Kimi K2. Да, релизнули только большую модель, но скоро, по идее, её должны дистиллировать это в модели помельче, так что и у простых смертных на улице будет праздник. Модель исключительно Instruct — ризонер выпустят отдельной моделью чуть позже. Происходит это из-за того что команде Qwen слишком сложно засовывать два режима в одну модель, в результате модель работает хуже чем отдельные ризонер/инстракт модели. Тем не менее они не прекращают работать над гибридными ризонерами, так что есть шансы что эту проблему решат. Веса

Технологии293 дня назад

Точка сингулярности💥

Китайцы обновили Qwen3-235B-A22B и это теперь новая лучшая опенсорс модель Активных параметров — 22B. По бенчам в математике и программировании показывает себя лучше, чем DeepSeek V3, Claude Opus 4 и даже Kimi K2 не долго модель была топом . На секундочку — на ARC-AGI у нее 42%! У многих закрытых все еще ниже 40. При этом Qwen работает без ризонинга. Тестим бесплатно тут #КаталогНейросетей

Технологии292 дня назад

Video is not supported

PROJECT+ | Нейросети

Вышла Qwen 3-Coder — мощнейшая open-source модель для программирования с агентными возможностями. Она уверенно держится на уровне закрытых гигантов вроде Claude 4, а в некоторых задачах даже превосходит их. Вместе с моделью выкатили полноценного ИИ-агента, который работает прямо в терминале. По сути — это альтернатива Gemini Code, только проще и дешевле. Пробуем новую имбу — здесь.

Технологии292 дня назад

Bard AI | Нейросети & IT

Ещё один релиз от китайцев: вышла Qwen3-Coder. Новая топовая опенсорс агентная модель для кодинга Это MoE-модель с 480B параметров 35B активных . Контекст 256K токенов, масштабируется до 1M. Уверенно обходит Kimi K2, DeepSeek V3 и другие открытые модели на SWE-bench-Verified, WebArena и прочих бенчах. Вместе с ней — выкатили CLI-агент Qwen Code, форк Gemini, но с нормальной реализацией prompts + function calls. Ставится через npm, работает из терминала Тестим бесплатно здесь, Hugging Face тут, код агента тут Bard & Gemini

Технологии292 дня назад

Video is not supported

Нейросети & Технологии | DeepTech

Лучший ИИ-агент для написания кода Компания Qwen представила свою новую агентную модель Qwen 3-Coder, которая превосходит многих конкурентов, среди которых Kimi K2 и DeepSeek V3, и демонстрирует результаты лучше, чем GPT-4.1. Однако модель пока не достигла уровня Claude 4 Sonnet в определенных задачах. Протестировать это достижение можно бесплатно через чат-бот. ———————————————— - Канал про тренды из мира IT, технологий, нейросетей и бизнеса.

Технологии292 дня назад

Нейросети & Технологии | DeepTech

Обновление Qwen3 превзошло конкурентов в бенчмарках Обновленная модель Qwen3-235B-A22B демонстрирует впечатляющие результаты, превосходя Claude 4 Opus и Kimi K2 в тестах. Она не использует ризонинг, но при этом выдает качественные тексты и решает задачи по математике, наукам и программированию. База обучения была расширена на всех языках, а работа с контекстом улучшена до 256 тысяч токенов, что позволяет загружать объемные тексты. Пробуйте бесплатно тут. ———————————————— - Канал про тренды из мира IT, технологий, нейросетей и бизнеса.

Технологии293 дня назад

Video is not supported

Bard AI | Нейросети & IT

Новый лидер в опенсорс-ИИ: китайцы выкатили обновлённую Qwen3-235B-A22B Это Instruct-модель с 22 млрд активных параметров архитектура MoE . Несмотря на отсутствие reasoning-режима, она уверенно обходит Kimi K2, Claude 4 Opus и DeepSeek V3 в задачах по математике, программированию и даже показывает 42% на ARC-AGI — результат, который превосходит многие закрытые модели Тестим бесплатно здесь, Hugging Face тут

Технологии293 дня назад

Нейродвиж

Qwen бомбят релизами: китайцы выпустили Qwen 3-Coder — это новая ЛУЧШАЯ опенсорс агентная модель для кодинга. Моделька почти не уступает закрытому Claude 4, а кое-где и превосходит. Вместе с нейросетью опубликовали и ИИ-агента: работающего в терминале — это буквально форк Gemini Code, но дешевле. Пробуем новую имбу — здесь.

Технологии292 дня назад

эйай ньюз

Qwen 3 Coder Ещё один релиз от китайцев, тоже без ризонинга. На кодинг и агентных бенчах почти дотягивает до Claude 4 Sonnet. Нативно поддерживает до 256к токенов контекста, но масштабируется до миллиона с использованием YaRN. Архитектурно это MoE на 480B параметров 35B активных , который натренировали на 7.5 триллионах токенов, 70% из них — код. Это почти в 5 раз меньше датасет чем у оригинального Qwen 3. Много внимание уделили скейлингу RL — модель учили решать реальные задачи используя реальные тулы в течении множества попыток. Чтобы это всё нормально тренировалось, они скейлили свою RL систему до 20к параллельных энвайронментов. В официальном API у модели очень резко растёт цена с длиной контекста: до 32k контекста модель стоит $1/$5 за миллион токенов, при 128k-256k — стоит как Claude Sonnet, а при миллионе токенов контекста цена доходит до бешенных $6/$60 за миллион токенов. Так что вряд ли стоит использовать официальное API — сторонние API провайдеры хоть и дают пока лишь до 262к контекста, но там нет шанса стать на грабли бешеного прайсинга. Да и цена у сторонних провайдеров заметно ниже — самый дешёвый отдаёт модель по цене $1.5/$2 за миллион токенов. С моделью опубликовали и Qwen Code — форк Gemini CLI, специально заточенный под Qwen Coder. Для пользователей Claude Code запустили совместимый с API Anthropic эндпоинт, но ему присущи все проблемы официального API. С большим любопытством слежу за противостоянием открытых китайских моделей и закрытых западных. Китайцы уж очень дышат в затылок своими опенсорсными моделями. Веса Блогпост Qwen Code

Технологии292 дня назад

Video is not supported

AI и точка.

Qwen3-Coder — новая лучшая open source ИИ-модель для кодинга. Всего 480 млрд параметров, 35 млрд активных. По программистским бенчмаркам обгоняет недавнюю Kimi K2, DeepSeek-V3, GPT-4.1 и даже Claude Sonnet 4. В тестах на агентность — приближается к Sonnet 4. Также компания выпустила Qwen Code — агента для кодинга, работающего в командной строке. Пообщаться с Qwen3-Coder можно бесплатно здесь. Qwen Code выложили на GitHub.

Технологии292 дня назад

Qwen3-235B-A22B: Новая модель опенсорс ИИ обходит конкурентов в бенчмарках

Источники

Павел Дуров анонсировал успех TON в стейкинге среди криптовалют

Qualcomm анонсировала новые процессоры Snapdragon 6 Gen 5 и 4 Gen 5 для улучшения производительности недорогих смартфонов

Microsoft тестирует новую функцию для Windows 11, ускоряющую запуск приложений

Завершение производства Tesla Model S и X: последние автомобили сошли с конвейера

Hisense анонсировала игровой монитор GX Ultra с 5K разрешением и Mini LED подсветкой

Во Владивостоке стартовал ремонт спортивных площадок на улицах Овчинникова и Морозова