5 августа, 21:32

Alibaba представляет новый генератор изображений Qwen Image с улучшенными возможностями редактирования

Qwen Image  Новый открытый генератор картинок от китайцев из Alibaba — они не перестают закидывать нас релизами. Помимо просто генерации картинок, модель очень хорошо умеет в текст и редактирование изображений, на уровне или лучше GPT 4o и FLUX Kontext.    Технически это MMDiT  как Stable Diffusion 3 или FLUX.1  на 20B параметров, что прямо много для консьюмерских карточек, но посмотрим что смогут сделать умельцы. Для редактирования используют чуть более продвинутую версию подхода из FLUX Kontext — модели так же дают увидеть изначальное изображение в процессе редактирования, но ввели свою схему для positional encoding.  Эта модель явно в канве работ над омни моделями, надеюсь Qwen 4/Qwen 5 будут полноценным мультимодальным претрейном. Кроме весов выложили и детальный техрепорт о тренировке модели, который я разберу где-то на днях.  Веса Блогпост Техрепорт
эйай ньюз
эйай ньюз
Qwen Image Новый открытый генератор картинок от китайцев из Alibaba — они не перестают закидывать нас релизами. Помимо просто генерации картинок, модель очень хорошо умеет в текст и редактирование изображений, на уровне или лучше GPT 4o и FLUX Kontext. Технически это MMDiT как Stable Diffusion 3 или FLUX.1 на 20B параметров, что прямо много для консьюмерских карточек, но посмотрим что смогут сделать умельцы. Для редактирования используют чуть более продвинутую версию подхода из FLUX Kontext — модели так же дают увидеть изначальное изображение в процессе редактирования, но ввели свою схему для positional encoding. Эта модель явно в канве работ над омни моделями, надеюсь Qwen 4/Qwen 5 будут полноценным мультимодальным претрейном. Кроме весов выложили и детальный техрепорт о тренировке модели, который я разберу где-то на днях. Веса Блогпост Техрепорт
Мегагенератор картинок релизнули китайцы — Qwen Image буквально уничтожает всех конкурентов по бенчам. И да, эта пушка бесплатна.  • Генерит любые пикчи: сюжеты, портреты, пейзажи, аниме, мультики, постеры и даже целые комиксы. • С текстом работает на ура! Ничем не уступает ChatGPT, не допускает ошибок и не придумывает чушь. • Редачит контент без артефактов — нейронка не меняет исходник, не добавляет ерунду и не ломает композицию. • Ограничений — нет, регистрации — нет. Нейронку сразу дропнули в открытый доступ и для всех!  Креативим — тут.
Дневник Технаря
Дневник Технаря
Мегагенератор картинок релизнули китайцы — Qwen Image буквально уничтожает всех конкурентов по бенчам. И да, эта пушка бесплатна. • Генерит любые пикчи: сюжеты, портреты, пейзажи, аниме, мультики, постеры и даже целые комиксы. • С текстом работает на ура! Ничем не уступает ChatGPT, не допускает ошибок и не придумывает чушь. • Редачит контент без артефактов — нейронка не меняет исходник, не добавляет ерунду и не ломает композицию. • Ограничений — нет, регистрации — нет. Нейронку сразу дропнули в открытый доступ и для всех! Креативим — тут.
GPT/ChatGPT/AI Central Александра Горного
GPT/ChatGPT/AI Central Александра Горного
Qwen выпустил генератор изображений с открытым кодом Главная особенность Qwen-Image — генерация текста на картинках. Модель хорошо работает с латиницей и иероглифами. Попробовать можно тут: Код:
Рисовые гении выпустили новую мощную модель для генерации картинок — Qwen Image. В тестах она оставила конкурентов позади. И при этом — полностью бесплатна: — Генерит что угодно: от портретов и аниме до пейзажей, постеров и даже комиксов; — Не чудит с текстом: модель идеально генерит надписи, на уровне ChatGPT. Не совершает ошибок и не добавляет ничего лишнего; — Редактирует результат без артефактов, как Flux Kontext - вся суть исходника сохраняется; — Нет никаких лимитов и регистрации. Нейронка лежит в открытом доступе. Скачать можно — отсюда.      #dtновости #новости
digital times
digital times
Рисовые гении выпустили новую мощную модель для генерации картинок — Qwen Image. В тестах она оставила конкурентов позади. И при этом — полностью бесплатна: — Генерит что угодно: от портретов и аниме до пейзажей, постеров и даже комиксов; — Не чудит с текстом: модель идеально генерит надписи, на уровне ChatGPT. Не совершает ошибок и не добавляет ничего лишнего; — Редактирует результат без артефактов, как Flux Kontext - вся суть исходника сохраняется; — Нет никаких лимитов и регистрации. Нейронка лежит в открытом доступе. Скачать можно — отсюда. #dtновости #новости
Alibaba научила ИИ писать   Qwen-Image - новая модель генерации изображений с открытым доступом, которая умеет аккуратно вписывать английский и китайский текст на вывески, плакаты и обложки книг. В бенчмарках она обошла конкурентов и уже доступна на GitHub и Hugging Face.  А как же "KФΞ 2Ч/7" вместо "Кофе 24/7"
Уютный IT
Уютный IT
Alibaba научила ИИ писать Qwen-Image - новая модель генерации изображений с открытым доступом, которая умеет аккуратно вписывать английский и китайский текст на вывески, плакаты и обложки книг. В бенчмарках она обошла конкурентов и уже доступна на GitHub и Hugging Face. А как же "KФΞ 2Ч/7" вместо "Кофе 24/7"
Loading indicator gif
Alibaba представила мощный опенсорс-генератор изображений Qwen-Image   Alibaba Group выпустила Qwen-Image, новую модель генерации изображений с открытым исходным кодом. Эта система способна создавать визуальные образы по текстовым описаниям и выделяется поддержкой встроенного текста на английском и китайском языках — редкая и важная особенность для мультиязычного мира.   Модель доступна в двух вариантах: — Qwen-Image-Large  на основе 1.6B параметров  — Qwen-Image-Tiny  более компактная версия, 0.5B параметров    Особенности Qwen-Image:    Поддержка генерации изображений с встроенным текстом  напр., логотипы, постеры     Высокое качество композиции и понимание контекста    Эффективность на мультиязычных промптах    Основана на диффузионной архитектуре с fine-tuning на собственных синтетических данных   Alibaba отмечает, что Qwen-Image успешно прошла бенчмарки на генерацию изображений с текстом, включая TIGBench, где превзошла такие модели, как DALL-E 3.   Исходный код и веса моделей доступны для свободного использования в научных и коммерческих проектах, что делает Qwen-Image одной из самых доступных и мощных альтернатив среди открытых генераторов.     Пользователи могут взаимодействовать с моделью прямо в Qwen Chat, выбрав режим "Генерация изображений" из кнопок под полем ввода запроса.  #ИнструментыИИ #ImageGeneration #Qwen     Time2Future        Каталог ИИ       Новости ИИ
Time2Future I ИИ медиа
Time2Future I ИИ медиа
Alibaba представила мощный опенсорс-генератор изображений Qwen-Image Alibaba Group выпустила Qwen-Image, новую модель генерации изображений с открытым исходным кодом. Эта система способна создавать визуальные образы по текстовым описаниям и выделяется поддержкой встроенного текста на английском и китайском языках — редкая и важная особенность для мультиязычного мира. Модель доступна в двух вариантах: — Qwen-Image-Large на основе 1.6B параметров — Qwen-Image-Tiny более компактная версия, 0.5B параметров Особенности Qwen-Image: Поддержка генерации изображений с встроенным текстом напр., логотипы, постеры Высокое качество композиции и понимание контекста Эффективность на мультиязычных промптах Основана на диффузионной архитектуре с fine-tuning на собственных синтетических данных Alibaba отмечает, что Qwen-Image успешно прошла бенчмарки на генерацию изображений с текстом, включая TIGBench, где превзошла такие модели, как DALL-E 3. Исходный код и веса моделей доступны для свободного использования в научных и коммерческих проектах, что делает Qwen-Image одной из самых доступных и мощных альтернатив среди открытых генераторов. Пользователи могут взаимодействовать с моделью прямо в Qwen Chat, выбрав режим "Генерация изображений" из кнопок под полем ввода запроса. #ИнструментыИИ #ImageGeneration #Qwen Time2Future Каталог ИИ Новости ИИ
БлоGнот
БлоGнот
Alibaba представила новую модель для генерации изображений Qwen-Image. В ней используются 20 миллиардов параметров, использует архитектура MMDiT. Особенность, которую компания позиционирует как ключевую — нормальная генерация текста на изображениях, причем даже иероглифы. Западные модели до сих пор не справляются с азиатскими языками — DALL-E рисует какие-то каракули вместо иероглифов. Qwen-Image правильно генерирует и смешанный текст, и рукописный и даже презентацию о самой себе. На бенчмарках, по их словам, обходят всех. Доступ пока только через веб-интерфейс. Но лицензия Apache 2.0, так что, когда выложат, будет интересно посмотреть на работу комьюнити. Тем более, что западные модели и с европейскими языками пока не на 100% справились.
Alibaba представила новый ИИ-генератор изображений Qwen-Image 20B MMDiT. Модель обладает усовершенствованными механизмами прорисовки сложных текстов и возможностью точного редактирования изображений.   Источник изображения: huggingface.co/Qwen  Модель поддерживает многоязычные макеты, включая иероглифы и буквы, и успешно справляется с задачами генерации и редактирования изображений, показывая высокое качество в тестах, таких как LongText-Bench и ChineseWord. Qwen-Image также поддерживает различные художественные жанры и операции редактирования, включая изменение стиля и улучшение деталей.   Узнать больше можно по ссылке на оригинал статьи.
Unlim AI
Unlim AI
Alibaba представила новый ИИ-генератор изображений Qwen-Image 20B MMDiT. Модель обладает усовершенствованными механизмами прорисовки сложных текстов и возможностью точного редактирования изображений. Источник изображения: huggingface.co/Qwen Модель поддерживает многоязычные макеты, включая иероглифы и буквы, и успешно справляется с задачами генерации и редактирования изображений, показывая высокое качество в тестах, таких как LongText-Bench и ChineseWord. Qwen-Image также поддерживает различные художественные жанры и операции редактирования, включая изменение стиля и улучшение деталей. Узнать больше можно по ссылке на оригинал статьи.
Qwen Image — мощный AI-генератор от Alibaba уже в открытом доступе  Alibaba представила Qwen Image — бесплатную нейросеть, которая уже обошла конкурентов в бенчмарках и сразу доступна для всех. Это открытая модель с мощным мультимодальным движком.  Что умеет: - Генерирует любые изображения: портреты, сюжеты, аниме, постеры, комиксы. - Читает и редактирует текст на изображении — четко, без фантазий и ошибок. - Поддерживает правки без артефактов — не портит оригинал и не ломает композицию. - Работает без лимитов, без регистрации и прямо из коробки.  Инструмент уже доступен по ссылке.  Tokensales   News   WaitingRoom
Incrypted
Incrypted
Qwen Image — мощный AI-генератор от Alibaba уже в открытом доступе Alibaba представила Qwen Image — бесплатную нейросеть, которая уже обошла конкурентов в бенчмарках и сразу доступна для всех. Это открытая модель с мощным мультимодальным движком. Что умеет: - Генерирует любые изображения: портреты, сюжеты, аниме, постеры, комиксы. - Читает и редактирует текст на изображении — четко, без фантазий и ошибок. - Поддерживает правки без артефактов — не портит оригинал и не ломает композицию. - Работает без лимитов, без регистрации и прямо из коробки. Инструмент уже доступен по ссылке. Tokensales News WaitingRoom
Qwen-Image — мультиязычная генеративная модель от Alibaba. Проект предлагает 20-миллиардную модель для создания изображений с точным рендерингом текста. Модель поддерживает английский и китайский языки, включая сложные шрифтовые композиции и смешанные текстовые блоки. Архитектура сочетает Qwen2.5-VL для анализа текста, VAE для детализации и диффузионное ядро MMDiT.    Модель обучалась на миллиардах изображений: от природных сцен до дизайн-макетов. В тестах она превзошла многие закрытые аналоги, особенно в генерации инфографики и материалов с встроенным текстом. Лицензия Apache 2.0 позволяет свободное использование.      GitHub
Анализ данных (Data analysis)
Анализ данных (Data analysis)
Qwen-Image — мультиязычная генеративная модель от Alibaba. Проект предлагает 20-миллиардную модель для создания изображений с точным рендерингом текста. Модель поддерживает английский и китайский языки, включая сложные шрифтовые композиции и смешанные текстовые блоки. Архитектура сочетает Qwen2.5-VL для анализа текста, VAE для детализации и диффузионное ядро MMDiT. Модель обучалась на миллиардах изображений: от природных сцен до дизайн-макетов. В тестах она превзошла многие закрытые аналоги, особенно в генерации инфографики и материалов с встроенным текстом. Лицензия Apache 2.0 позволяет свободное использование. GitHub
Loading indicator gif