16 декабря, 22:18

Google анонсировала Veo 2 — новый видеомодельный ИИ с поддержкой 4K

Чёрный Треугольник
Чёрный Треугольник
Google представила Veo 2 — новый видеомодельный ИИ, который оставляет конкурентов, таких как Sora Turbo от OpenAI, далеко позади. Эта мощная система способна генерировать 8-секундные видео с разрешением до 4K, демонстрируя выдающееся понимание физики и реалистичные движения, свет и глубину в кадре. Качество изображения значительно возросло, а количество "галлюцинаций" существенно сократилось. Veo 2 также умеет комбинировать различные кинематографические форматы и управлять "камерой" для создания уникальных и креативных историй. В тестах он превзошел множество конкурентов, включая Minimax, Kling и Meta Movie Gen. . ================ News Software Hardware
БлоGнот
БлоGнот
Google набрал ход и удивляет своими запусками в области AI — сегодня компания показала новые версии своих моделей для генерации видео и изображений — Veo 2 и Imagen 3, а также представила новый экспериментальный инструмент Whisk. Veo 2 демонстрирует впечатляющие результаты в создании видео, лучше понимает физику реального мира и нюансы человеческих движений. Модель также разбирается в кинематографии — может работать с разными жанрами, объективами и спецэффектами, создавая видео разрешением до 4K и длительностью в несколько минут. При этом она реже "галлюцинирует" лишние детали вроде дополнительных пальцев. Правда, пока что он доступен только в приложении VideoFX, которое доступно только по инвайтам. Правда, Google обещает, что на этой неделе количество пользователей приложения увеличится. Imagen 3 теперь создает более яркие и композиционно выверенные изображения, лучше следует промптам и может работать в различных художественных стилях — от фотореализма до аниме. Модель уже доступна в ImageFX более чем в 100 странах. Новый инструмент Whisk позволяет использовать изображения в качестве промптов для визуализации идей. Он комбинирует Imagen 3 с визуальными возможностями Gemini — последний автоматически создает детальное описание загруженных изображений, которое затем используется Imagen 3 для создания новых вариаций. Впрочем, Whisk нам недоступен, так что подождем всё сразу пробовать.
Подарок, который точно не разочарует
₿tc-card.com
₿tc-card.com
Подарок, который точно не разочарует
Нажми Enter | Тренды, IT и бизнес
Нажми Enter | Тренды, IT и бизнес
Убийцу Sora представила Google — Veo 2 может генерировать 8-секундные видео с разрешением 4К Нейронка поразительно точно понимает физику объектов, движений, света и глубины. Также она может комбинировать различные кинематографические форматы и управлять «камерой» для создания уникальных кадров. Ждём релиз.
эйай ньюз
эйай ньюз
Veo 2 — новая SOTA видео-генерация?! Google стратегически дождались релиза Sora от OpenAI, чтобы сразу представить свою ответку. По их внутренним тестам, Veo 2 заметно опережает конкурентов. Правда, я бы не стал слепо доверять их тестам, согласно которым клинг чуть ли не лучше MovieGen и Sora. Однако, черрипики на сайте выглядят впечатляюще. Как минимум, фламинго не путает передние и задние ноги и Veo 2 почти безошибочно справился с фигуристкой. Но с более динамичными сценами пока есть трудности, о чём сами признаются в DeepMind — см. пример со скейтбордистом. Технических деталей немного, кроме того, что модель на релизе выдаёт разрешение 720p с возможностью дойти до 4К! Длина видео — 8 секунд, золотая середина между 5-ю и 10-ю секундами, где уже чаще возникают артефакты. Картинки на вход, вроде бы, пока не принимает. Есть даже регистрация в вейтлист, правда чтобы туда добавили просят заполнить небольшую анкету, да и сколько ждать — неизвестно. Надеюсь, гугл не будет опять годами держать модель за семью печатями.