5 августа, 21:32

Alibaba представляет новый генератор изображений Qwen Image с улучшенными возможностями редактирования

Подготовлено редакцией Tek.fmДайджест Telegram-каналов

Qwen Image Новый открытый генератор картинок от китайцев из Alibaba — они не перестают закидывать нас релизами. Помимо просто генерации картинок, модель очень хорошо умеет в текст и редактирование изображений, на уровне или лучше GPT 4o и FLUX Kontext. Технически это MMDiT как Stable Diffusion 3 или FLUX.1 на 20B параметров, что прямо много для консьюмерских карточек, но посмотрим что смогут сделать умельцы. Для редактирования используют чуть более продвинутую версию подхода из FLUX Kontext — модели так же дают увидеть изначальное изображение в процессе редактирования, но ввели свою схему для positional encoding. Эта модель явно в канве работ над омни моделями, надеюсь Qwen 4/Qwen 5 будут полноценным мультимодальным претрейном. Кроме весов выложили и детальный техрепорт о тренировке модели, который я разберу где-то на днях. Веса Блогпост Техрепорт

Технологии279 дней назад

Мегагенератор картинок релизнули китайцы — Qwen Image буквально уничтожает всех конкурентов по бенчам. И да, эта пушка бесплатна. • Генерит любые пикчи: сюжеты, портреты, пейзажи, аниме, мультики, постеры и даже целые комиксы. • С текстом работает на ура! Ничем не уступает ChatGPT, не допускает ошибок и не придумывает чушь. • Редачит контент без артефактов — нейронка не меняет исходник, не добавляет ерунду и не ломает композицию. • Ограничений — нет, регистрации — нет. Нейронку сразу дропнули в открытый доступ и для всех! Креативим — тут.

Дневник Технаря

Мегагенератор картинок релизнули китайцы — Qwen Image буквально уничтожает всех конкурентов по бенчам. И да, эта пушка бесплатна. • Генерит любые пикчи: сюжеты, портреты, пейзажи, аниме, мультики, постеры и даже целые комиксы. • С текстом работает на ура! Ничем не уступает ChatGPT, не допускает ошибок и не придумывает чушь. • Редачит контент без артефактов — нейронка не меняет исходник, не добавляет ерунду и не ломает композицию. • Ограничений — нет, регистрации — нет. Нейронку сразу дропнули в открытый доступ и для всех! Креативим — тут.

Технологии279 дней назад

Qwen Image — мощный AI-генератор от Alibaba уже в открытом доступе Alibaba представила Qwen Image — бесплатную нейросеть, которая уже обошла конкурентов в бенчмарках и сразу доступна для всех. Это открытая модель с мощным мультимодальным движком. Что умеет: - Генерирует любые изображения: портреты, сюжеты, аниме, постеры, комиксы. - Читает и редактирует текст на изображении — четко, без фантазий и ошибок. - Поддерживает правки без артефактов — не портит оригинал и не ломает композицию. - Работает без лимитов, без регистрации и прямо из коробки. Инструмент уже доступен по ссылке. Tokensales News WaitingRoom

Incrypted

Qwen Image — мощный AI-генератор от Alibaba уже в открытом доступе Alibaba представила Qwen Image — бесплатную нейросеть, которая уже обошла конкурентов в бенчмарках и сразу доступна для всех. Это открытая модель с мощным мультимодальным движком. Что умеет: - Генерирует любые изображения: портреты, сюжеты, аниме, постеры, комиксы. - Читает и редактирует текст на изображении — четко, без фантазий и ошибок. - Поддерживает правки без артефактов — не портит оригинал и не ломает композицию. - Работает без лимитов, без регистрации и прямо из коробки. Инструмент уже доступен по ссылке. Tokensales News WaitingRoom

Технологии277 дней назад

Qwen-Image — мультиязычная генеративная модель от Alibaba. Проект предлагает 20-миллиардную модель для создания изображений с точным рендерингом текста. Модель поддерживает английский и китайский языки, включая сложные шрифтовые композиции и смешанные текстовые блоки. Архитектура сочетает Qwen2.5-VL для анализа текста, VAE для детализации и диффузионное ядро MMDiT. Модель обучалась на миллиардах изображений: от природных сцен до дизайн-макетов. В тестах она превзошла многие закрытые аналоги, особенно в генерации инфографики и материалов с встроенным текстом. Лицензия Apache 2.0 позволяет свободное использование. GitHub

Анализ данных (Data analysis)

Qwen-Image — мультиязычная генеративная модель от Alibaba. Проект предлагает 20-миллиардную модель для создания изображений с точным рендерингом текста. Модель поддерживает английский и китайский языки, включая сложные шрифтовые композиции и смешанные текстовые блоки. Архитектура сочетает Qwen2.5-VL для анализа текста, VAE для детализации и диффузионное ядро MMDiT. Модель обучалась на миллиардах изображений: от природных сцен до дизайн-макетов. В тестах она превзошла многие закрытые аналоги, особенно в генерации инфографики и материалов с встроенным текстом. Лицензия Apache 2.0 позволяет свободное использование. GitHub

Технологии274 дня назад

Alibaba представила мощный опенсорс-генератор изображений Qwen-Image Alibaba Group выпустила Qwen-Image, новую модель генерации изображений с открытым исходным кодом. Эта система способна создавать визуальные образы по текстовым описаниям и выделяется поддержкой встроенного текста на английском и китайском языках — редкая и важная особенность для мультиязычного мира. Модель доступна в двух вариантах: — Qwen-Image-Large на основе 1.6B параметров — Qwen-Image-Tiny более компактная версия, 0.5B параметров Особенности Qwen-Image: Поддержка генерации изображений с встроенным текстом напр., логотипы, постеры Высокое качество композиции и понимание контекста Эффективность на мультиязычных промптах Основана на диффузионной архитектуре с fine-tuning на собственных синтетических данных Alibaba отмечает, что Qwen-Image успешно прошла бенчмарки на генерацию изображений с текстом, включая TIGBench, где превзошла такие модели, как DALL-E 3. Исходный код и веса моделей доступны для свободного использования в научных и коммерческих проектах, что делает Qwen-Image одной из самых доступных и мощных альтернатив среди открытых генераторов. Пользователи могут взаимодействовать с моделью прямо в Qwen Chat, выбрав режим "Генерация изображений" из кнопок под полем ввода запроса. #ИнструментыИИ #ImageGeneration #Qwen Time2Future Каталог ИИ Новости ИИ

Time2Future I ИИ медиа

Alibaba представила мощный опенсорс-генератор изображений Qwen-Image Alibaba Group выпустила Qwen-Image, новую модель генерации изображений с открытым исходным кодом. Эта система способна создавать визуальные образы по текстовым описаниям и выделяется поддержкой встроенного текста на английском и китайском языках — редкая и важная особенность для мультиязычного мира. Модель доступна в двух вариантах: — Qwen-Image-Large на основе 1.6B параметров — Qwen-Image-Tiny более компактная версия, 0.5B параметров Особенности Qwen-Image: Поддержка генерации изображений с встроенным текстом напр., логотипы, постеры Высокое качество композиции и понимание контекста Эффективность на мультиязычных промптах Основана на диффузионной архитектуре с fine-tuning на собственных синтетических данных Alibaba отмечает, что Qwen-Image успешно прошла бенчмарки на генерацию изображений с текстом, включая TIGBench, где превзошла такие модели, как DALL-E 3. Исходный код и веса моделей доступны для свободного использования в научных и коммерческих проектах, что делает Qwen-Image одной из самых доступных и мощных альтернатив среди открытых генераторов. Пользователи могут взаимодействовать с моделью прямо в Qwen Chat, выбрав режим "Генерация изображений" из кнопок под полем ввода запроса. #ИнструментыИИ #ImageGeneration #Qwen Time2Future Каталог ИИ Новости ИИ

Технологии279 дней назад

БлоGнот

Alibaba представила новую модель для генерации изображений Qwen-Image. В ней используются 20 миллиардов параметров, использует архитектура MMDiT. Особенность, которую компания позиционирует как ключевую — нормальная генерация текста на изображениях, причем даже иероглифы. Западные модели до сих пор не справляются с азиатскими языками — DALL-E рисует какие-то каракули вместо иероглифов. Qwen-Image правильно генерирует и смешанный текст, и рукописный и даже презентацию о самой себе. На бенчмарках, по их словам, обходят всех. Доступ пока только через веб-интерфейс. Но лицензия Apache 2.0, так что, когда выложат, будет интересно посмотреть на работу комьюнити. Тем более, что западные модели и с европейскими языками пока не на 100% справились.

Технологии278 дней назад

GPT/ChatGPT/AI Central Александра Горного

Qwen выпустил генератор изображений с открытым кодом Главная особенность Qwen-Image — генерация текста на картинках. Модель хорошо работает с латиницей и иероглифами. Попробовать можно тут: Код:

Технологии278 дней назад

Рисовые гении выпустили новую мощную модель для генерации картинок — Qwen Image. В тестах она оставила конкурентов позади. И при этом — полностью бесплатна: — Генерит что угодно: от портретов и аниме до пейзажей, постеров и даже комиксов; — Не чудит с текстом: модель идеально генерит надписи, на уровне ChatGPT. Не совершает ошибок и не добавляет ничего лишнего; — Редактирует результат без артефактов, как Flux Kontext - вся суть исходника сохраняется; — Нет никаких лимитов и регистрации. Нейронка лежит в открытом доступе. Скачать можно — отсюда. #dtновости #новости

digital times

Рисовые гении выпустили новую мощную модель для генерации картинок — Qwen Image. В тестах она оставила конкурентов позади. И при этом — полностью бесплатна: — Генерит что угодно: от портретов и аниме до пейзажей, постеров и даже комиксов; — Не чудит с текстом: модель идеально генерит надписи, на уровне ChatGPT. Не совершает ошибок и не добавляет ничего лишнего; — Редактирует результат без артефактов, как Flux Kontext - вся суть исходника сохраняется; — Нет никаких лимитов и регистрации. Нейронка лежит в открытом доступе. Скачать можно — отсюда. #dtновости #новости

Технологии278 дней назад

Alibaba научила ИИ писать Qwen-Image - новая модель генерации изображений с открытым доступом, которая умеет аккуратно вписывать английский и китайский текст на вывески, плакаты и обложки книг. В бенчмарках она обошла конкурентов и уже доступна на GitHub и Hugging Face. А как же "KФΞ 2Ч/7" вместо "Кофе 24/7"

Уютный IT

Alibaba научила ИИ писать Qwen-Image - новая модель генерации изображений с открытым доступом, которая умеет аккуратно вписывать английский и китайский текст на вывески, плакаты и обложки книг. В бенчмарках она обошла конкурентов и уже доступна на GitHub и Hugging Face. А как же "KФΞ 2Ч/7" вместо "Кофе 24/7"

Технологии276 дней назад

Новая модель для генерации изображений Alibaba представила открытую модель генерации изображений, которая особенно хорошо работает с текстом. Qwen-Image умеет создавать реалистичные надписи на разных поверхностях, включая сложные шрифты и многоязычные композиции. Модель построена на архитектуре MMDiT с 20 млрд параметров и превосходит аналоги в тестах. Она особенно хорошо справляется с китайскими иероглифами, сохраняя читаемость даже в мелких деталях. Qwen-Image умеет редактировать существующие изображения, добавлять объекты и менять позы персонажей. Пока с русским языком результаты хуже, чем с английским и китайским. #онлайн #ИИ

Комп для чайника

Новая модель для генерации изображений Alibaba представила открытую модель генерации изображений, которая особенно хорошо работает с текстом. Qwen-Image умеет создавать реалистичные надписи на разных поверхностях, включая сложные шрифты и многоязычные композиции. Модель построена на архитектуре MMDiT с 20 млрд параметров и превосходит аналоги в тестах. Она особенно хорошо справляется с китайскими иероглифами, сохраняя читаемость даже в мелких деталях. Qwen-Image умеет редактировать существующие изображения, добавлять объекты и менять позы персонажей. Пока с русским языком результаты хуже, чем с английским и китайским. #онлайн #ИИ

Технологии271 день назад