5 августа, 21:32
Alibaba представляет новый генератор изображений Qwen Image с улучшенными возможностями редактирования


эйай ньюз
Qwen Image Новый открытый генератор картинок от китайцев из Alibaba — они не перестают закидывать нас релизами. Помимо просто генерации картинок, модель очень хорошо умеет в текст и редактирование изображений, на уровне или лучше GPT 4o и FLUX Kontext. Технически это MMDiT как Stable Diffusion 3 или FLUX.1 на 20B параметров, что прямо много для консьюмерских карточек, но посмотрим что смогут сделать умельцы. Для редактирования используют чуть более продвинутую версию подхода из FLUX Kontext — модели так же дают увидеть изначальное изображение в процессе редактирования, но ввели свою схему для positional encoding. Эта модель явно в канве работ над омни моделями, надеюсь Qwen 4/Qwen 5 будут полноценным мультимодальным претрейном. Кроме весов выложили и детальный техрепорт о тренировке модели, который я разберу где-то на днях. Веса Блогпост Техрепорт
Технологии8 дней назад


Дневник Технаря
Мегагенератор картинок релизнули китайцы — Qwen Image буквально уничтожает всех конкурентов по бенчам. И да, эта пушка бесплатна. • Генерит любые пикчи: сюжеты, портреты, пейзажи, аниме, мультики, постеры и даже целые комиксы. • С текстом работает на ура! Ничем не уступает ChatGPT, не допускает ошибок и не придумывает чушь. • Редачит контент без артефактов — нейронка не меняет исходник, не добавляет ерунду и не ломает композицию. • Ограничений — нет, регистрации — нет. Нейронку сразу дропнули в открытый доступ и для всех! Креативим — тут.
Технологии7 дней назад

GPT/ChatGPT/AI Central Александра Горного
Qwen выпустил генератор изображений с открытым кодом Главная особенность Qwen-Image — генерация текста на картинках. Модель хорошо работает с латиницей и иероглифами. Попробовать можно тут: Код:
Технологии7 дней назад


digital times
Рисовые гении выпустили новую мощную модель для генерации картинок — Qwen Image. В тестах она оставила конкурентов позади. И при этом — полностью бесплатна: — Генерит что угодно: от портретов и аниме до пейзажей, постеров и даже комиксов; — Не чудит с текстом: модель идеально генерит надписи, на уровне ChatGPT. Не совершает ошибок и не добавляет ничего лишнего; — Редактирует результат без артефактов, как Flux Kontext - вся суть исходника сохраняется; — Нет никаких лимитов и регистрации. Нейронка лежит в открытом доступе. Скачать можно — отсюда. #dtновости #новости
Технологии6 дней назад


Уютный IT
Alibaba научила ИИ писать Qwen-Image - новая модель генерации изображений с открытым доступом, которая умеет аккуратно вписывать английский и китайский текст на вывески, плакаты и обложки книг. В бенчмарках она обошла конкурентов и уже доступна на GitHub и Hugging Face. А как же "KФΞ 2Ч/7" вместо "Кофе 24/7"
Технологии4 дня назад



Time2Future I ИИ медиа
Alibaba представила мощный опенсорс-генератор изображений Qwen-Image Alibaba Group выпустила Qwen-Image, новую модель генерации изображений с открытым исходным кодом. Эта система способна создавать визуальные образы по текстовым описаниям и выделяется поддержкой встроенного текста на английском и китайском языках — редкая и важная особенность для мультиязычного мира. Модель доступна в двух вариантах: — Qwen-Image-Large на основе 1.6B параметров — Qwen-Image-Tiny более компактная версия, 0.5B параметров Особенности Qwen-Image: Поддержка генерации изображений с встроенным текстом напр., логотипы, постеры Высокое качество композиции и понимание контекста Эффективность на мультиязычных промптах Основана на диффузионной архитектуре с fine-tuning на собственных синтетических данных Alibaba отмечает, что Qwen-Image успешно прошла бенчмарки на генерацию изображений с текстом, включая TIGBench, где превзошла такие модели, как DALL-E 3. Исходный код и веса моделей доступны для свободного использования в научных и коммерческих проектах, что делает Qwen-Image одной из самых доступных и мощных альтернатив среди открытых генераторов. Пользователи могут взаимодействовать с моделью прямо в Qwen Chat, выбрав режим "Генерация изображений" из кнопок под полем ввода запроса. #ИнструментыИИ #ImageGeneration #Qwen Time2Future Каталог ИИ Новости ИИ
Технологии7 дней назад

БлоGнот
Alibaba представила новую модель для генерации изображений Qwen-Image. В ней используются 20 миллиардов параметров, использует архитектура MMDiT. Особенность, которую компания позиционирует как ключевую — нормальная генерация текста на изображениях, причем даже иероглифы. Западные модели до сих пор не справляются с азиатскими языками — DALL-E рисует какие-то каракули вместо иероглифов. Qwen-Image правильно генерирует и смешанный текст, и рукописный и даже презентацию о самой себе. На бенчмарках, по их словам, обходят всех. Доступ пока только через веб-интерфейс. Но лицензия Apache 2.0, так что, когда выложат, будет интересно посмотреть на работу комьюнити. Тем более, что западные модели и с европейскими языками пока не на 100% справились.
Технологии7 дней назад


Unlim AI
Alibaba представила новый ИИ-генератор изображений Qwen-Image 20B MMDiT. Модель обладает усовершенствованными механизмами прорисовки сложных текстов и возможностью точного редактирования изображений. Источник изображения: huggingface.co/Qwen Модель поддерживает многоязычные макеты, включая иероглифы и буквы, и успешно справляется с задачами генерации и редактирования изображений, показывая высокое качество в тестах, таких как LongText-Bench и ChineseWord. Qwen-Image также поддерживает различные художественные жанры и операции редактирования, включая изменение стиля и улучшение деталей. Узнать больше можно по ссылке на оригинал статьи.
Технологии7 дней назад


Incrypted
Qwen Image — мощный AI-генератор от Alibaba уже в открытом доступе Alibaba представила Qwen Image — бесплатную нейросеть, которая уже обошла конкурентов в бенчмарках и сразу доступна для всех. Это открытая модель с мощным мультимодальным движком. Что умеет: - Генерирует любые изображения: портреты, сюжеты, аниме, постеры, комиксы. - Читает и редактирует текст на изображении — четко, без фантазий и ошибок. - Поддерживает правки без артефактов — не портит оригинал и не ломает композицию. - Работает без лимитов, без регистрации и прямо из коробки. Инструмент уже доступен по ссылке. Tokensales News WaitingRoom
Технологии6 дней назад


Анализ данных (Data analysis)
Qwen-Image — мультиязычная генеративная модель от Alibaba. Проект предлагает 20-миллиардную модель для создания изображений с точным рендерингом текста. Модель поддерживает английский и китайский языки, включая сложные шрифтовые композиции и смешанные текстовые блоки. Архитектура сочетает Qwen2.5-VL для анализа текста, VAE для детализации и диффузионное ядро MMDiT. Модель обучалась на миллиардах изображений: от природных сцен до дизайн-макетов. В тестах она превзошла многие закрытые аналоги, особенно в генерации инфографики и материалов с встроенным текстом. Лицензия Apache 2.0 позволяет свободное использование. GitHub
Технологии3 дня назад

Похожие новости



+1



+11



+1



+2



+4


Pika представляет новые инструменты для создания говорящих видео и ИИ-аватаров
Технологии
1 час назад




Российский рынок платформ для ИИ-инференса ожидает рост до 15 млрд рублей к 2025 году
Технологии
4 часа назад




Photoshop теперь с ИИ-агентом Claude для полной автоматизации редактирования
Технологии
1 час назад




Омск и другие города участвуют в глобальном проекте пиксель-арта на Wplace
Общество
2 часа назад




Запуск российского мессенджера «Молния» с интеграцией торговых сервисов
Технологии
1 час назад




Конкуренция в ИИ: OpenAI увеличивает лимиты, Илон Маск делает Grok 4 бесплатным
Технологии
1 день назад
