эйай ньюз
04.08.2025 16:30
Qwen Image Новый открытый генератор картинок от китайцев из Alibaba — они не перестают закидывать нас релизами. Помимо просто генерации картинок, модель очень хорошо умеет в текст и редактирование изображений, на уровне или лучше GPT 4o и FLUX Kontext. Технически это MMDiT как Stable Diffusion 3 или FLUX.1 на 20B параметров, что прямо много для консьюмерских карточек, но посмотрим что смогут сделать умельцы. Для редактирования используют чуть более продвинутую версию подхода из FLUX Kontext — модели так же дают увидеть изначальное изображение в процессе редактирования, но ввели свою схему для positional encoding. Эта модель явно в канве работ над омни моделями, надеюсь Qwen 4/Qwen 5 будут полноценным мультимодальным претрейном. Кроме весов выложили и детальный техрепорт о тренировке модели, который я разберу где-то на днях. Веса Блогпост Техрепорт
эйай ньюз
01.08.2025 08:43
Runway релизунули Aleph — in-context видеоредактор. Aleph может изменять ракурсы камеры, добавлять и удалять объекты, менять окружение и время суток, переносить стиль, изменять возраст персонажей и даже применять движение из одного видео к статичной картинке. Отдельно выделяется возможность перенести объект в кадре на зелёный фон, что в целом может убить профессию ротоскопера. По сути, это универсальный VFX-комбайн для постпродакшена, который позволяет делать с видео практически всё что угодно с помощью текстовых промптов. До этого редактировать видео по-настоящему умела только Pika, да и мелькало несколько опенсорс-решений с костылями для Wan. Все они были интересны как концепт, но в целом некрасивы от слова совсем. Черипики, конечно, очень сочные, как всегда у Runway, но пока непонятно, что выйдет на самом деле. Возможно, потребуется не одна крутка, прежде чем получится что-то нормальное. Го тестить! Хотя вот Act-Two вышел достойным и без оверхайпа. Уже доступен у всех платных юзеров. Анонс с примерами
эйай ньюз
25.07.2025 15:06
Yandex B2B Tech открыл бизнесу доступ к обновлённому Qwen3 Компания запустила в своём облаке Qwen3‑235B‑A22B‑Instruct‑2507, которая стала крупнейшей моделью в Yandex Cloud. Модель умеет удерживать большой контекст для более точных логических и интеллектуальных задач, поддерживает 119 языков и диалектов, пишет код, обладает обширной базой знаний и даёт быстрые, точные ответы с улучшенной персонализацией по сравнению с предыдущей версией. Для бизнеса модель доступна в Yandex Cloud AI Studio — через API по стандарту OpenAI. Это позволяет быстро собирать ИИ‑агентов без крупных инвестиций: от автоматизации поддержки и виртуальных ассистентов для e‑commerce до создания корпоративных кодовых ассистентов. Стоимость — 50 копеек за 1 000 токенов. Источник
эйай ньюз
23.07.2025 05:35
Qwen 3 Coder Ещё один релиз от китайцев, тоже без ризонинга. На кодинг и агентных бенчах почти дотягивает до Claude 4 Sonnet. Нативно поддерживает до 256к токенов контекста, но масштабируется до миллиона с использованием YaRN. Архитектурно это MoE на 480B параметров 35B активных , который натренировали на 7.5 триллионах токенов, 70% из них — код. Это почти в 5 раз меньше датасет чем у оригинального Qwen 3. Много внимание уделили скейлингу RL — модель учили решать реальные задачи используя реальные тулы в течении множества попыток. Чтобы это всё нормально тренировалось, они скейлили свою RL систему до 20к параллельных энвайронментов. В официальном API у модели очень резко растёт цена с длиной контекста: до 32k контекста модель стоит $1/$5 за миллион токенов, при 128k-256k — стоит как Claude Sonnet, а при миллионе токенов контекста цена доходит до бешенных $6/$60 за миллион токенов. Так что вряд ли стоит использовать официальное API — сторонние API провайдеры хоть и дают пока лишь до 262к контекста, но там нет шанса стать на грабли бешеного прайсинга. Да и цена у сторонних провайдеров заметно ниже — самый дешёвый отдаёт модель по цене $1.5/$2 за миллион токенов. С моделью опубликовали и Qwen Code — форк Gemini CLI, специально заточенный под Qwen Coder. Для пользователей Claude Code запустили совместимый с API Anthropic эндпоинт, но ему присущи все проблемы официального API. С большим любопытством слежу за противостоянием открытых китайских моделей и закрытых западных. Китайцы уж очень дышат в затылок своими опенсорсными моделями. Веса Блогпост Qwen Code
эйай ньюз
22.07.2025 18:44
Colossus 2 почти готов xAI, уже через несколько недель, начнут вводить в строй кластер из 550к GB200/GB300 на жидкостном охлаждении. Чтобы запитать этого монстра, xAI купили электростанцию в другой стране и привезли её в США — обойтись мобильными генераторами, как в случае с оригинальным Colossus, не вышло. Добро пожаловать в эру гигаваттных кластеров
эйай ньюз
21.07.2025 19:53
Qwen 3 обновили 235B теперь по куче бенчей обходит Claude 4 Opus и Kimi K2. Да, релизнули только большую модель, но скоро, по идее, её должны дистиллировать это в модели помельче, так что и у простых смертных на улице будет праздник. Модель исключительно Instruct — ризонер выпустят отдельной моделью чуть позже. Происходит это из-за того что команде Qwen слишком сложно засовывать два режима в одну модель, в результате модель работает хуже чем отдельные ризонер/инстракт модели. Тем не менее они не прекращают работать над гибридными ризонерами, так что есть шансы что эту проблему решат. Веса
эйай ньюз
18.07.2025 14:59
Т‑Банк завёз открытый свежачок: T-pro 2.0 32B русскоязычная модель на базе Qwen3‑32B. Модель прогнали через 40 млрд токенов претрейна треть из них reasoning , потом долили ~500к SFT‑промптов и ещё 100к пар для preference‑tuning, так что она заметно лучше думает на русском. На публичных бенчах получаем +5‑10 процентных пунктов к голому Qwen3‑32B: ruMMLU 79 % +5 , Ru‑Arena‑Hard 87,6 % +4,4 , MERA 66 % +7,6 — среди локальных языковых моделей это один из лучших результатов прямо сейчас. Детали тренировки обещают завтра, на Turbo ML Conf. Модель — гибридный ризонер, с 32к контекста, которые растягиваются до 131к при помощи YaRN. Авторы опубликовали не просто чекпоинт — релизнули сразу и официальную fp8 версию плюс пачку GGUF, так что модель могут использовать обычные юзеры без плясок с бубном. Натренировали и Eagle драфт модель, которая даёт до 60% прироста в скорости инференса при маленьких батчах — скорость растёт с 69 токенов в секунду до 110. Лицензия — Apache 2.0, так что можно спокойно юзать в любых целях, в том числе коммерческих. Веса
эйай ньюз
17.07.2025 18:00
ChatGPT Agent — Deep Research и Operator теперь одно целое Внутри теперь единая модель которая может пользоваться всеми тулами: текстовый и визуальный браузеры, терминал, прямой API доступ и коннекторы Gmail, GitHub, etc. — всё, что раньше жило раздельно в Operator и Deep Research, собрано в одном режиме. Агент теперь умеет заниматься и офисными задачами: генерировать редактируемые презентации и таблицы, обновлять их данными и подтягивать файлы Docs/Slides/PowerPoint/Sheets из подключённых облаков. Обновлённая модель достигает 41.6% на Humanity s Last Exam, что немного ниже чем у Grok 4 Heavy, но сильно выше чем у изначального Deep Research режима. Запустив 8 параллельных прогонов и взяв лучший по самооценке, OpenAI смогли улучшить результат до 44.4%, то есть ровно до уровня Grok 4 Heavy. Важная фича — агент сможет теперь спрашивать уточнения задачи во время её выполнения, но и вы теперь сможете прерывать агента и давать дополнительные указания если он делает что-то не то. Завершённые задачи можно ставить на расписание еженедельные отчёты, брифы перед созвонами — агент будет повторять их автоматически. Довольно много внимания уделили фичам для безопасности: подтверждение перед необратимыми действиями, Watch Mode для чувствительных задач вроде финансов , плюс проактивные меры против prompt‑injection. Ну и конечно можно вмешаться и остановить задачу в любой момент. Пока что safety фичи работают очень агрессивно, но количество false positives обещают постепенно уменьшать. Доступ начнут давать уже сегодня Pro, Plus и Team подписчикам. Все Pro подписчики получат доступ сегодня, остальным придётся подождать до пары дней. Pro подписчики получат 400 сообщений в месяц, Plus и Team — 40. Кредиты можно будет дополнительно докупать, цену не сказали.
эйай ньюз
15.07.2025 18:27
Thinking Machines привлекли 2 миллиарда По слухам, стартап Миры Мурати, бывшей CTO OpenAI которая недолго побыла и CEO, а также известная своим гримасничаньем , уже оценивается в 10 миллиардов долларов. Мира ушла из OpenAI только осенью прошлого года, утащив с собой несколько заметных сотрудников. Неплохо так, за меньше чем год с нуля получили такую же оценку как Cursor. Через несколько месяцев стартап собирается релизнуть первый продукт. Что это будет — пока непонятно, но обещают что в нём будет "заметный опенсорс компонент". Плюс обещают публиковать ресёрч в interpretability фронтирных моделей, что всегда хорошо. Но я до сих пор не понимаю, что именно они собираются делать. Если стартап Ильи Суцкевера я могу понять, то этот нет.
эйай ньюз
14.07.2025 12:52
Grok теперь аниме-девочка Новая фича Companions даёт гроку анимированные аватары в голосовом режиме. Кроме аниме-девочки Ani, доступна ещё красная панда Bad Rudy, а скоро обещают добавить и третьего компаньона. Доступно на iOS подписчикам SuperGrok. Маск идёт на крайние меры чтобы все забыли МехаГитлера