26 февраля, 17:29

Alibaba представила новую опенсорс модель Wan 2.1 для генерации видео

эйай ньюз
эйай ньюз
Alibaba Wan 2.1 - новая SOTA опенсорс видео модель Скорее всего это та самая загадочная модель, которая уже месяц доступна в Qwen Chat. На лидерборде VBench она занимает первое место, но там нет нескольких сильных конкурентов, вроде Veo 2 от гугла. Больше бенчей никаких нет, так что ждём полноценного техрепорта и тем временем вайбчекаем модель по генерациям . По ним, например, видно что модель очень хорошо генерирует текст, как на английском, так и на китайском, с чем другие модели справляются куда хуже. Идёт в двух размерах — 1.3B и 14B и в нескольких разных вариантах для разных разрешений поддерживаются 480p и 720p . Маленькой 1.3B модели нужно всего 8,2 гигабайта VRAM для запуска, а на генерацию видео уходит всего 4 минуты на 4090. Большая моделька потребляет заметно больше — вплоть до 77 гигабайт. Но модели совсем не оптимизированные замеры по памяти делали с fp32 моделями , так что есть много простора для оптимизации. Посмотрите на тот же Hunyuan, который при ~таком же количестве параметров неплохо запускается на консьюмерских видяхах. Умельцы за пару недель ещё оптимизируют эти модели, чтобы запускалось на каждом холодильнике. Веса Код wanxai.com
Alibaba представила конкурентный ИИ-генератор видео Wan 2.1, доступный для создания видео и изображений по текстовым запросам. Модели включают T2V-1.3B, T2V-14B, I2V-14B-720P и I2V-14B-480P, содержащие от 1,3 до 14 миллиардов параметров.   Модели доступны для пользователей на платформах HuggingFace и ModelScope. Wan 2.1 получила высокие оценки за взаимодействие объектов в тестах Vbench, а компания планирует инвестировать 52 миллиарда долларов в развитие облачных вычислений и ИИ.  Источник изображения: Alibaba  Дополнительную информацию можно найти здесь и здесь.
Unlim AI
Unlim AI
Alibaba представила конкурентный ИИ-генератор видео Wan 2.1, доступный для создания видео и изображений по текстовым запросам. Модели включают T2V-1.3B, T2V-14B, I2V-14B-720P и I2V-14B-480P, содержащие от 1,3 до 14 миллиардов параметров. Модели доступны для пользователей на платформах HuggingFace и ModelScope. Wan 2.1 получила высокие оценки за взаимодействие объектов в тестах Vbench, а компания планирует инвестировать 52 миллиарда долларов в развитие облачных вычислений и ИИ. Источник изображения: Alibaba Дополнительную информацию можно найти здесь и здесь.
Alibaba открыла Wan 2.1 для всех — ИИ-генератор видео и «убийцу OpenAI Sora»  Alibaba сделала Wan 2.1, свой самый продвинутый ИИ-генератор видео и изображений, общедоступным. Модель теперь можно использовать на Alibaba Cloud ModelScope и Hugging Face для исследовательских и коммерческих целей. Wan 2.1 представлен в четырёх версиях: T2V-1.  Читать далее
DNS_Club
DNS_Club
Alibaba открыла Wan 2.1 для всех — ИИ-генератор видео и «убийцу OpenAI Sora» Alibaba сделала Wan 2.1, свой самый продвинутый ИИ-генератор видео и изображений, общедоступным. Модель теперь можно использовать на Alibaba Cloud ModelScope и Hugging Face для исследовательских и коммерческих целей. Wan 2.1 представлен в четырёх версиях: T2V-1. Читать далее
PRO AI | ПОЛЕЗНЫЙ СОФТ | НОВОСТИ
PRO AI | ПОЛЕЗНЫЙ СОФТ | НОВОСТИ
Лаборатория Alibaba Tongyi выпустила Wan2.1, набор мощных моделей генерации видео с открытым исходным кодом, которые превосходят модели с открытым исходным кодом и закрытые модели SOTA, такие как SORA, по ключевым показателям, при этом генерируя видео в 2,5 раза быстрее. Wan2.1-T2V-14B возглавляет таблицу лидеров VBench, преуспевая в таких областях, как сложная динамика движения, моделирование реальной физики и генерация текста. Все модели поддерживают преобразование текста в видео, изображение в видео и преобразование видео в аудио и являются первыми моделями с возможностью рендеринга текста как на английском, так и на китайском языках. Релиз также включает в себя легкую версию 1.3B, способную работать на потребительском оборудовании — она может генерировать 5-секундный клип 480P на RTX 4090 за 4 минуты. PRO AI ПОЛЕЗНЫЙ СОФТ НОВОСТИ
Будущее вместо банальщины! Подари BTC Card и сделай праздник прибыльным
₿tc-card.com
₿tc-card.com
Будущее вместо банальщины! Подари BTC Card и сделай праздник прибыльным
GPT/ChatGPT/AI Central Александра Горного
GPT/ChatGPT/AI Central Александра Горного
Wan2.1 — опенсорсный AI для генерации видео от Alibaba Модель может генерировать видео по тексту и изображениям. Wan 2.1 вышла в двух размерах: 14B и 1.3B. Меньшая требует чуть больше 8 ГБ видеопамяти и способна работать на видеокартах из потребительского сегмента. Код:
ИА Реалист
ИА Реалист
Компания Alibaba выпустит версию с открытым исходным кодом своей модели искусственного интеллекта для генерации видео и изображений Wan 2.1. Выпуск модели Alibaba произошел на фоне усиления конкуренции на рынке искусственного интеллекта в Китае после запуска DeepSeek своих последних моделей с открытым исходным кодом в прошлом месяце. Эти модели потрясли мировую индустрию искусственного интеллекта, предоставив производительность, сопоставимую с ведущими продуктами таких компаний, как OpenAI, которая перешла на предложения с закрытым исходным кодом. Первоначально Alibaba представила свою последнюю версию модели искусственного интеллекта для генерации видео и изображений в январе, позже переименовав ее в Wan из Wanx, подчеркнув способность модели генерировать высокореалистичные визуальные эффекты.
NEUROHUB🔥
NEUROHUB🔥
Новый генератор видео от Alibaba — Wan2.1. Умеет генерировать видео по тексту и изображениям. Состоит из 2-ух моделей: «легкой» Wan2.1-T2V-1.3B и «тяжелой» Wan2.1-I2V-14B. Младшая за 4 минуты генерирует 5-секундное видео в 480p на RTX 4090 , а старшая — выдает 480p и 720p. Демо-версию можно потестить онлайн, а код лежит на Github.
vc.ru
vc.ru
Китайская Alibaba представила модель для генерации видео Wan 2.1 с открытым исходным кодом. В соцсетях пишут, что она «лучше» Veo 2 от Google vc.ru/ai/1834565
Чёрный Треугольник
Чёрный Треугольник
Alibaba представила Wan 2.1 — новую open source модель ИИ для генерации изображений и видео. Wan 2.1 включает четыре версии, которые значительно улучшают точность генерации: T2V-1.3B, T2V-14B, I2V-14B-720P и I2V-14B-480P. Версии с обозначением "14B" используют 14 миллиардов параметров для создания высококачественных визуализаций, в то время как T2V-1.3B требует 8.19 ГБ VRAM, что позволяет работать на потребительском оборудовании. Модель поддерживает различные форматы, включая текст в видео и редактирование видео. Alibaba предоставляет бесплатный доступ к Wan 2.1 через свою платформу и обещает открыть ее исходный код во втором квартале 2025 года. Кроме того, Alibaba объявила о планах инвестировать 380 миллиардов юаней примерно $52 миллиарда в развитие своей ИИ инфраструктуры в течение следующих трех лет. ================ News Soft Gear Links