26 февраля, 17:29
Alibaba представила новую опенсорс модель Wan 2.1 для генерации видео

эйай ньюз
Alibaba Wan 2.1 - новая SOTA опенсорс видео модель Скорее всего это та самая загадочная модель, которая уже месяц доступна в Qwen Chat. На лидерборде VBench она занимает первое место, но там нет нескольких сильных конкурентов, вроде Veo 2 от гугла. Больше бенчей никаких нет, так что ждём полноценного техрепорта и тем временем вайбчекаем модель по генерациям . По ним, например, видно что модель очень хорошо генерирует текст, как на английском, так и на китайском, с чем другие модели справляются куда хуже. Идёт в двух размерах — 1.3B и 14B и в нескольких разных вариантах для разных разрешений поддерживаются 480p и 720p . Маленькой 1.3B модели нужно всего 8,2 гигабайта VRAM для запуска, а на генерацию видео уходит всего 4 минуты на 4090. Большая моделька потребляет заметно больше — вплоть до 77 гигабайт. Но модели совсем не оптимизированные замеры по памяти делали с fp32 моделями , так что есть много простора для оптимизации. Посмотрите на тот же Hunyuan, который при ~таком же количестве параметров неплохо запускается на консьюмерских видяхах. Умельцы за пару недель ещё оптимизируют эти модели, чтобы запускалось на каждом холодильнике. Веса Код wanxai.com
Технологии143 дня назад


Unlim AI
Alibaba представила конкурентный ИИ-генератор видео Wan 2.1, доступный для создания видео и изображений по текстовым запросам. Модели включают T2V-1.3B, T2V-14B, I2V-14B-720P и I2V-14B-480P, содержащие от 1,3 до 14 миллиардов параметров. Модели доступны для пользователей на платформах HuggingFace и ModelScope. Wan 2.1 получила высокие оценки за взаимодействие объектов в тестах Vbench, а компания планирует инвестировать 52 миллиарда долларов в развитие облачных вычислений и ИИ. Источник изображения: Alibaba Дополнительную информацию можно найти здесь и здесь.
Технологии142 дня назад


DNS_Club
Alibaba открыла Wan 2.1 для всех — ИИ-генератор видео и «убийцу OpenAI Sora» Alibaba сделала Wan 2.1, свой самый продвинутый ИИ-генератор видео и изображений, общедоступным. Модель теперь можно использовать на Alibaba Cloud ModelScope и Hugging Face для исследовательских и коммерческих целей. Wan 2.1 представлен в четырёх версиях: T2V-1. Читать далее
Технологии142 дня назад

PRO AI | ПОЛЕЗНЫЙ СОФТ | НОВОСТИ
Лаборатория Alibaba Tongyi выпустила Wan2.1, набор мощных моделей генерации видео с открытым исходным кодом, которые превосходят модели с открытым исходным кодом и закрытые модели SOTA, такие как SORA, по ключевым показателям, при этом генерируя видео в 2,5 раза быстрее. Wan2.1-T2V-14B возглавляет таблицу лидеров VBench, преуспевая в таких областях, как сложная динамика движения, моделирование реальной физики и генерация текста. Все модели поддерживают преобразование текста в видео, изображение в видео и преобразование видео в аудио и являются первыми моделями с возможностью рендеринга текста как на английском, так и на китайском языках. Релиз также включает в себя легкую версию 1.3B, способную работать на потребительском оборудовании — она может генерировать 5-секундный клип 480P на RTX 4090 за 4 минуты. PRO AI ПОЛЕЗНЫЙ СОФТ НОВОСТИ
Технологии142 дня назад

Нейродвиж
Китайцы опять унижают OpenAI — Alibaba выпустили БЕСПЛАНЫЙ и ОПЕНСОРСНЫЙ генератор видосов, который уделывает Sora. При этом модель не требовательная — нужна видяха на 8 Гб для запуска. Инфа по установке — здесь.
Технологии142 дня назад


skidmarket.ru
Не упустите шанс заказать продукты и товары домой с максимальной экономией.
Реклама142 дня назад

GPT/ChatGPT/AI Central Александра Горного
Wan2.1 — опенсорсный AI для генерации видео от Alibaba Модель может генерировать видео по тексту и изображениям. Wan 2.1 вышла в двух размерах: 14B и 1.3B. Меньшая требует чуть больше 8 ГБ видеопамяти и способна работать на видеокартах из потребительского сегмента. Код:
Технологии143 дня назад

ИА Реалист
Компания Alibaba выпустит версию с открытым исходным кодом своей модели искусственного интеллекта для генерации видео и изображений Wan 2.1. Выпуск модели Alibaba произошел на фоне усиления конкуренции на рынке искусственного интеллекта в Китае после запуска DeepSeek своих последних моделей с открытым исходным кодом в прошлом месяце. Эти модели потрясли мировую индустрию искусственного интеллекта, предоставив производительность, сопоставимую с ведущими продуктами таких компаний, как OpenAI, которая перешла на предложения с закрытым исходным кодом. Первоначально Alibaba представила свою последнюю версию модели искусственного интеллекта для генерации видео и изображений в январе, позже переименовав ее в Wan из Wanx, подчеркнув способность модели генерировать высокореалистичные визуальные эффекты.
Технологии142 дня назад

NEUROHUB🔥
Новый генератор видео от Alibaba — Wan2.1. Умеет генерировать видео по тексту и изображениям. Состоит из 2-ух моделей: «легкой» Wan2.1-T2V-1.3B и «тяжелой» Wan2.1-I2V-14B. Младшая за 4 минуты генерирует 5-секундное видео в 480p на RTX 4090 , а старшая — выдает 480p и 720p. Демо-версию можно потестить онлайн, а код лежит на Github.
Технологии142 дня назад

vc.ru
Китайская Alibaba представила модель для генерации видео Wan 2.1 с открытым исходным кодом. В соцсетях пишут, что она «лучше» Veo 2 от Google vc.ru/ai/1834565
Технологии142 дня назад

Чёрный Треугольник
Alibaba представила Wan 2.1 — новую open source модель ИИ для генерации изображений и видео. Wan 2.1 включает четыре версии, которые значительно улучшают точность генерации: T2V-1.3B, T2V-14B, I2V-14B-720P и I2V-14B-480P. Версии с обозначением "14B" используют 14 миллиардов параметров для создания высококачественных визуализаций, в то время как T2V-1.3B требует 8.19 ГБ VRAM, что позволяет работать на потребительском оборудовании. Модель поддерживает различные форматы, включая текст в видео и редактирование видео. Alibaba предоставляет бесплатный доступ к Wan 2.1 через свою платформу и обещает открыть ее исходный код во втором квартале 2025 года. Кроме того, Alibaba объявила о планах инвестировать 380 миллиардов юаней примерно $52 миллиарда в развитие своей ИИ инфраструктуры в течение следующих трех лет. ================ News Soft Gear Links
Технологии142 дня назад

Похожие новости



+9



+1



+2



+39



+1



+1

Т-Банк и «Т-Технологии» представили языковую модель T-Pro 2.0 с гибридным режимом рассуждений
Технологии
5 часов назад




Компания Runway представила обновленную функцию Act-Two для генерации видео с эмоциями
Игры
1 день назад




Китайские инженеры представили нейроинтерфейс LoongX для редактирования изображений силой мысли
Технологии
1 день назад




OpenAI запускает режим ChatGPT Agent для выполнения задач
Технологии
18 часов назад




OpenAI запускает режим записи для Zoom, упрощая рабочие процессы
Технологии
9 часов назад




Higgsfield запускает конструктор для создания рекламных роликов за один клик
Технологии
18 часов назад


