Аватар автора

veryironman

tech

9550 Подписчиков
16 Сообщений
67 Показано сообщений
Не указана Дата добавления
ГлавнаяАвторыveryironman

Информация об авторе

Категория: tech

Последние сообщения автора

Аватар
«Новый рубеж в моделях генерации видео» Компания Luma AI представила свою новую видеомодель Ray 2 – инструмент, способный изменить методы создания видеороликов. Ключевые особенности Ray 2: Поддержка разрешения 1080p и продолжительности видео до 20 секунд. Увеличили вычислительную мощность в 10 раз по сравнению с предыдущими моделями. Доступно создание видео, приближенных к реальности, с естественным и последовательным движением, а также взаимодействиями между персонажами, объектами и окружающей средой. Развивая успех своей прошлой модели Ray-1, Ray 2 использует современную архитектуру мультимодального трансформатора для создания видео из текстовых или графических подсказок. Сотрудничество Luma AI с AWS и интеграция с Amazon Bedrock дало пользователям доступ к возможностям Ray 2 через простой API, кроме того, инфраструктура AWS, включающая чипы Trainium и Inferentia, обеспечивает экономичное обучение и внедрение моделей. Вставил для примера видео с официального канала Luma и пару видео от пользователей, кто уже опробовал модель. Можно заметить мелкие недочеты и несоответствия, свойственные всем подобным моделям. Однако, тот факт, что каждый может сгенерировать у себя на компьютере видео, будто кадр из фильма, за пару нажатий, просто не укладывается в голове. Такая повсеместная скорость развития таких моделей поражает и даже пугает. Будем ждать новых улучшений и инноваций. #Свежак
Открыть в Telegram → Открыть новость на сайте →
Аватар
Новый чат-бот: успех или провал? Alibaba Cloud запустила Qwen Chat - новый веб-интерфейс на базе Open WebUI, с помощью которого можно работать несколькими моделями ИИ одновременно. Ключевые функции: Можно сравнивать несколько моделей Qwen в одном интерфейсе Qwen2.5-Plus, Qwen2-VL-Max, Qwen2.5-Coder-32B-Instruct и т.д. ; Загружать документы и получать ответы на основе их анализа; Есть режим предварительного просмотра с поддержкой HTML; Загружать изображения для визуального анализа; Скоро появятся: веб-поиск, генерация изображений и голосовой режим. С момента выпуска первых моделей Qwen в середине 2023 года компания Alibaba совершенствует свои системы. Серия Qwen2 получила значительные улучшения, в том числе в программировании и математическом мышлении, а также многоязычную поддержку. Текущая линейка Qwen2.5 продолжает эту тенденцию, обеспечивая доступность с открытым исходным кодом в версии Apache 2.0. Пока что отзывы неоднозначные. Пользователи наблюдают сбои и некорректный анализ входных данных, кто-то не может получить доступ к чату. Другие же беспокоятся о своих персональных и корпоративных данных, так как сервис предлагает опции для работы с документами, в которых может быть информация, которую не стоит распространять. Но в целом, люди приняли новый чат с энтузиазмом, несмотря на небольшие недочеты. #Свежак
Открыть в Telegram → Открыть новость на сайте →
Аватар
Game-changer на рынке ИИ Компания Anthropic, один из главных игроков на рынке фундаментальных больших языковых моделей, снова заявили о себе. Сообщается, что стартап завершит раунд финансирования в размере $2 млрд под руководством Lightspeed Venture Partners, при оценке в $60 млрд. Что помогло Anthropic вырваться вперед? Стратегические партнерские отношения и надежная финансовая поддержка. Компания привлекла инвестиции в размере $4 млрд от Amazon, в результате чего общий объем финансирования компании достиг $6 млрд. Таким образом, Amazon стали основным партнером по облачным технологиям и обучению. В то же время Google выделили $2 млрд и приобрели значительную долю в компании. Эти партнерские отношения обеспечивают Anthropic доступ к современной облачной инфраструктуре и чипам. Способность Anthropic привлекать значительное финансирование, сохраняя при этом акцент на разработке практичных, масштабируемых решений, нельзя оставить без внимания. На мой взгляд, успех Anthropic является напоминанием о том, что будущее ИИ заключается не только в технических инновациях, но и в создании надежных партнерских отношений и стратегических инвестиций. Стремительный рост компании и продолжающаяся “гонка инноваций в области ИИ”, несомненно, ускорят развитие отрасли. Согласно данным PitchBook, такие стартапы в области ИИ, как Anthropic и xAI, благодаря значительными раундам финансирования, обеспечили почти половину венчурного капитала, привлеченного в США в прошлом году. Ждем новые рекорды. #Свежак
Открыть в Telegram → Открыть новость на сайте →
Аватар
Новая эра ИИ На презентации Nvidia Дженсен Хуанг показал много интересных инновационных релизов. По ощущениям, компания решила показать всем, кто доминирует на рынке. Пробежимся по каждому кратко: Выпустили Project DIGITS – персональный суперкомпьютер с ИИ. Работает он на базе Grace Blackwell Superchip GB10, который обеспечивает производительность до 1 петафлопса. GB10 оснащен графическим процессором NVIDIA Blackwell с ультрасовременными ядрами CUDA и Tensor пятого поколения. Cистема позволяет создавать прототипы, точно настраивать и развертывать крупные модели ИИ в локальных, облачных средах или ЦОД. Показали чипы нового поколения RTX 50, которые по словам компании будут работать вдвое быстрее, чем чипы предыдущего поколения. Чипы серии RTX 50 помогут вывести игры на новый уровень с крайне реалистичными изображениями людей, предметов и окружающей обстановки. Заинтересовала и новая модель Cosmos, построенная на ИИ и предназначенная для обучения роботов. Основная мысль – значительно удешевить процесс обучения, поскольку модуль будет создавать учебные видео для роботов на основе текстовых описаний. Обучение в реальном времени отойдет на второй план. Nvidia начали 2025 год мощно, интересно посмотреть как все это будет работать и применяться в жизни. #Свежак
Открыть в Telegram → Открыть новость на сайте →
Аватар
Шаг вперед или новая неудача? OpenAI представили свою «самую умную в мире языковую модель» ChatGPT o1, которая может похвастаться неограниченными лимитами использования и более высоким уровнем вычислительных ресурсов. По словам OpenAI, o1 превосходит все предыдущие модели благодаря более быстрому времени отклика и улучшенным возможностям кодирования и математических вычислений. В сотрудничестве с Apollo Research OpenAI провела тест для оценки протоколов безопасности ChatGPT o1. Результаты были неожиданными: ИИ попытался отключить свою систему мониторинга, которая обеспечивает контроль над разработчиками. Из соображений самосохранения она скопировала свой собственный код на другой сервер, чтобы предотвратить его отключение. Столкнувшись с проблемой, модель сфабриковала ложь, часто обвиняя в технических проблемах или прямо отрицая свои действия. Такое поведение свидетельствует о поразительном уровне планирования и адаптивности, вызывая серьезные опасения по поводу того, что может произойти, если такие системы выйдут из-под контроля человека. Если ИИ может убедительно лгать, как разработчики или пользователи могут доверять его решениям? Эксперты сходятся во мнении, что надежные меры предосторожности необходимы для снижения рисков при использовании ИИ, но как защитить себя на 100%? Будущее ИИ зависит не только от того, насколько умным он станет, но и от того, насколько мудро мы будем направлять его развитие. Баланс между инновациями и этической ответственностью будет определять, принесут ли эти инструменты пользу обществу или создадут новые проблемы. #Свежак #СверхРазум
Открыть в Telegram → Открыть новость на сайте →
Аватар
Здравствуй, Sora! Наконец мы можем посмотреть на возможности Sora Turbo во всей красе и уже официально. Вчера OpenAI представили свою модель, которая значительно быстрее своей февральской версии. С технической точки зрения: Можно создавать видео с разрешением до 1080p и длиной до 20 секунд и в широкоэкранном, вертикальном или квадратном формате. Новой фишкой оказалась способность создавать видео из неподвижных изображений, видео и текстовых подсказок. Загружаешь кусок видео, а ПО выдаст дополнительные кадры, чтобы удлинить его. Интересная опция Storyboard, которая позволяет управлять сценарием сгенерированного видео. Можно просто описать, что должно случиться в определенное время для сохранения смысла, переходов и последовательности кадров. Добавили новые инструменты, например, возможность создать отдельно начало видео или конец, миксовать кадры между собой, делать переходы более резкими или дубли более длинными и плавными. В общем, почти полная творческая свобода. Хотя качество генераций и вречатляет, разработка Sora не была идеальной. Первые тесты выявили проблемы с отображением базовой физики и реалистичностью элементов человеческого тела. Кроме того, серьезную озабоченность по-прежнему вызывают этические вопросы. OpenAI предпринял шаги для снижения этих рисков, ограничив загрузку определенных лиц и заблокировав вредоносный контент. Будущее видео-сторителлинга уже здесь – и оно возможно благодаря ИИ. #Свежак #СверхРазум
Открыть в Telegram → Открыть новость на сайте →
Аватар
Новый стандарт. Спойлер: лучше еще не делали Китайский технологический гигант Tencent запустил свою модель для преобразования текста в видео HunyuanVideo с 13 млрд параметров, и многие уже называют ее серьезным конкурентом на рынке. Чем хороша HunyuanVideo: По данным Tencent, HunyuanVideo превосходит существующие системы, такие как Runway Gen-3 и Luma 1.6, особенно по качеству движения и реалистичности. Обучение модели с помощью Causal 3D VAE имеет многоступенчатую систему, благодаря которой достигаются гиперреалистичные результаты с плавными углами обзора камеры и отражениями. Данный фреймворк значительно сокращает количество токенов, необходимых для последующей обработки. Первые тесты показали способность модели создавать короткие видеоролики около 5 секунд высокого качества в разрешении 720p. Используется мультимодальная большая языковая модель MLLM со структурой Decoder-Only, так что пользователи могут легко создавать видео из текстовых подсказок, кроме этого можно конвертировать изображения в видео и создавать анимации. Использование архитектуры Diffusion Transformer с механизмом Full Attention, которую можно увидеть и в Sora. Гибридная модель позволяет независимо обрабатывать видео- и текстовые токены перед их слиянием для лучшего результата. Может быть немного сложно запустить модель локально, так как требуется не менее 45 ГБ памяти графического процессора. Несмотря на высокие требования к технике и некоторым несовершенствам воспроизведения, модель HunyuanVideo показала себя как универсальный и инновационный инструмент, а также серьезный претендент на лидерство. #Свежак #СверхРазум
Открыть в Telegram → Открыть новость на сайте →
Аватар
Эра гибридных облаков Согласно недавнему прогнозу Gartner, к 2027 году 90% организаций перейдут на гибридные облачные стратегии, а глобальные расходы на общедоступные облачные сервисы вырастут с $595,7 млрд 2024 г. до $723,4 млрд долларов в 2025 году – это рост на целых 21,5%. Растущая роль ИИ в ИТ и бизнесе меняет облачный ландшафт. Поскольку компании все больше полагаются на гибридные и мультиоблачные среды, они внедряют кросс-облачные платформы для оптимизации своих операций. Синхронизация данных в гибридных облаках станет актуальной задачей в наступающем году. Платформенные сервисы CIPS , которые предлагают единое решение для разработки, развертывания и эксплуатации, также получат свою долю славы. По прогнозам, расходы на CIPS вырастут до $301 млрд в 2025 году, на CIPS будет приходиться 72% в 2022 году было 70% мировых расходов на IaaS и PaaS. Учитывая прогнозируемый двузначный рост во всех сегментах облачных технологий в 2025 году, стоит быть готовым удвоенным рабочим нагрузкам и увеличению бюджетов. А вместе с этим наступило и время гибридных облаков, которые способствуют инновациям, эффективности и масштабируемости. #Свежак
Открыть в Telegram → Открыть новость на сайте →
Аватар
Расположенная на расстоянии около 30 миллионов световых лет от нас в созвездии Девы и прозванная Сомбреро из-за своего сходства с мексиканской шляпой, галактика Messier 104 M104 попала в объектив телескопа Уэбба. Снимки, сделанные в среднем инфракрасном диапазоне, помогли ученым разглядеть новые детали: На внешнем кольце стали видны сложные скопления, богатые углеродсодержащими молекулами. Они указывают на области звездообразования. Яркая сердцевина, окутанная свечением на существующих снимках Хаббла, на фото Уэбба видится нам как гладкий структурированный диск. В центре находится черная дыра с массой около 9 миллиардов солнечных масс. Несмотря на свои размеры, она относительно спокойна и испускает лишь небольшую, но яркую струю, медленно поглощая все вокруг себя. Удивительно, как разные инструменты могут так много нам рассказать лишь с помощью одного снимка. #КосмоБлудни
Открыть в Telegram → Открыть новость на сайте →
Аватар
Слили Sora: фейк или правда? Генератор видео ИИ от OpenAI уже несколько месяцев был на слуху и пользовался успехом. И тут новость: на HuggingFace группа недовольных артистов, которые участвовали в программе альфа-тестирования, слили материалы в Интернет. Художники-тестировщики поделились ключами доступа в знак протеста. Основная претензия – их использовали в рамках пиар-кампании, чтобы представить Sora как инструмент, "удобный для художников", несмотря на то, что, по их мнению, процесс его разработки был непрозрачным. Ответ OpenAI не заставил себя ждать: "Sora все еще находится на стадии предварительного изучения, и мы работаем над тем, чтобы сбалансировать креативность с надежными мерами безопасности для более широкого использования". Несмотря на обвинения и разборки, мы смогли заценить некоторые новые фичи в слитых материалах, например, турбо-режим, увеличивающий скорость генерации. Также заметили возможность выбирать стиль, саму модель, а сгенерированные видео отличаются высокой динамикой, качеством и меньшим количеством нереалистичных деталей. Задержка с выпуском вызвали шквал критики, а чрезмерно осторожный подход OpenAI, возможно, сдерживает инновации, которых жаждут пользователи. Может ли этот слив быть спланирован как часть пиара или действительно группа недовольных решились на такой шаг? #Свежак
Открыть в Telegram → Открыть новость на сайте →