Аватар автора

ai_newz

tech

52749 Подписчиков
55 Сообщений
175 Показано сообщений
Не указана Дата добавления
ГлавнаяАвторыai_newz

Информация об авторе

Категория: tech

Последние сообщения автора

Аватар
xAI Илона Маска официально анонсировали text2image модель Aurora После субботнего релиза и исчезновения модельки на какое-то время, появился блогпост с деталями и примерами генерации. Самое интересное - Aurora не диффузионка, а авторегрессионная модель. В отличие от диффузии, которая берёт шум и в течении нескольких шагов лепит из него картинку, Aurora генерит изображения маленькими, полностью готовыми, кусочками токенами . В процессе генерации изображение как-будто грузится сверху вниз, как раньше бывало при медленном интернете. Большой плюс такого подхода - к модели применимы оптимизации инференса LLM, и в нее можно легко кормить одновременно и картинки и текст. Хоть диффузию можно ускорять не меньше, иметь схожую архитектуру для всех моделей - это огромный плюс. Наверное поэтому Aurora это Mixture of Experts, ровно как и первая версия Grok. Хоть про Grok 2 мало что известно, вряд-ли xAI слезли с MoE. Из минусов такого подхода: 1 это скорость генерации, ведь нужно прогонять сеть отдельно для генерации каждого токена; 2 качество генерации. Видно гранулярность изображени, оно не всегда чёткое. Возможно это из-за того, что ради скорости пытались сделать токены большего размера. Ещё показали редактирование картинок по текстовому промпту - моделька меняет только нужные детали, а не изкажает изображение до неузнаваемости, в отличие от большинства других генераторов. Эту фичу завезут чуть позже, пока что она недоступна. Чтобы попробовать, нужен всего лишь бесплатный аккаунт в экс-твиттере.
Открыть в Telegram → Открыть новость на сайте →
Аватар
OpenAI официально показали Sora! Доступно будет всем подписчикам ChatGPT - и Plus и Pro. Дают кредитов на до 50 генераций в месяц Plus подписчикам и до 500 быстрых генераций Pro подписчикам. Pro подписчики с более 500 генераций попадают в "медленную очередь". Длина видео всё таки от 5 до 20 секунд для Plus максимум 5 , а разрешение от 480p до 1080p Plus подписчики ограничены 720p . На более длинные видео и видео разрешения уходит больше кредитов. К видео можно применять стили и создавать свои. Показали Storyboard - продвинутый инструмент позволяющий режиссировать видео. К примеру можно попросить Sora сгенерить видео человека, который на пятой секунде видео машет рукой. Ещё есть куча продвинутых инструментов - можно догенеривать до видео как начало так и концовку, смешивать несколько видео вместе разными способами и много чего ещё. Модерация сейчас чрезмерно строгая, но OpenAI обещают постепенно снимать ограничения. sora.com
Открыть в Telegram → Открыть новость на сайте →
Аватар
Вот почему Sora не пускали в сеть А еще релиз обещают сегодня! Я уже писал об этом, но тогда это были догадки. Marques Brownlee, крупнейший техноблогер YouTube, поделился своими тестами Sora и снял на нее обзор. Выше его тесты — бегом смотреть! Там, кстати, помимо видосов есть и обзор на UI, который подозрительно похож на MidJourney. Я еще не успел посмотреть сам обзор, сразу побегом к вам. Но так, на первый взгляд, в генерациях, конечно, есть косяки — это все-таки технология в разработке, а не магия. У чела, например, телефон то появляется, то пропадает. Но это не то чтобы сразу бросается в глаза, как у того же Runway. Понимание промпта — мое почтение! Кадр с новостями полностью сгенерирован без дополнительного монтажа, все плашки тоже на них, конечно, какой-то нонсенс, но все же! Их все равно никто не читает . Ну и очевидно, что OpenAI плевать хотели на копирайт помните жесткий фейл Мурати? . Они 100% использовали те же самые новости, видео ютуберов и со стоков, что прекрасно видно по генерациям. Ждем релиз и расчехляем свои кошельки на подписку! Анонс будет через 15 минут здесь.
Открыть в Telegram → Открыть новость на сайте →
Аватар
xAI Илона Маска запустили Aurora - свой собственный генератор картинок После вчерашнего апдейта использовать его можно бесплатно - 10 сообщений каждые два часа. Оригинальный Grok 2 с FLUX.1 пока ещё тоже доступен. grok.x.com
Открыть в Telegram → Открыть новость на сайте →
Аватар
Слухи оказались правдивыми - OpenAI запускает подписку за 200 долларов в месяц Подписка даст доступ к o1 pro режиму - модели позволят дольше думать над запросами. Также дают неограниченный доступ к o1, o1-mini и Advanced Voice Mode. Ещё o1 выходит из превью, релизная версия принимает на вход картинки и заметно лучше в математике и кодинге. Плюс она лучше понимает сколько нужно думать над таском - над простыми запросами теперь будет думать быстрее, над сложными - больше. А ведь ещё ходили слухи о подписке за $2k в месяц
Открыть в Telegram → Открыть новость на сайте →
Аватар
Colossus расширят минимум до миллиона видеокарт Размер суперкомпьютера xAI, который построили за рекордные четыре месяца, пару месяцев назад начали удваивать - к 100k H100 решили докинуть 50k H100 и 50k H200. Закончены ли уже работы - непонятно, но Маск вроде пока этим не хвастался. До лета следующего года планируется докинуть ещё 300к GB200, первые из которых начнут устанавливать уже в январе, за приоритетный доступ к GPU Маск заплатил больше миллиарда долларов. А вот сейчас выяснилось что и это не предел, а общее количество карт планируется довести более чем до миллиона. Для понимания масштабов - Llama 3 405B тренировали на 16k H100, Grok 2 - на 20k. Кластеры для тренировки других передовых моделей тоже находятся в пределах пары десятков тысяч GPU. Следующее поколение моделей, вроде Grok 3, тренируется уже на 100k+ GPU, а компании уже закладывают инфраструктуру на всё большую и большую тренировку. А ведь миллион GPU это не предел - уже какое-то время ходят слухи о многогигаваттных инсталляциях, стоимостью за сотню миллиардов долларов каждая, с многими миллионами чипов.
Открыть в Telegram → Открыть новость на сайте →
Аватар
Amazon релизнули Nova - новое поколение своих моделей В семействе четыре LLM - Micro, Lite, Pro и Premier. Первые три уже доступны на AWS, а Premier ещё тренируется. Все кроме Micro - мультимодальные. Модели вышли дороговатые - Pro по бенчам чуть лучше Llama 3.2 90B, но по сильно более высокой цене - $0.8/$3.2 за лям токенов у Pro, против $0.72/$0.72 у Llama на том же AWS. Но Amazon очень хочется чтобы сравнивали с передовыми моделями, поэтому все результаты Nova Pro в табличке выделили жирным, не смотря на результаты, хоть и сравнивают с GPT-4o и Claude Sonnet, которые сильно впереди. Что неплохо - длина контекста. Хоть у Micro она всего 128к, у Lite и Pro она уже солидные 300к. Этого уже достаточно чтобы туда засовывать видео, пусть и в маленьком фреймрейте. Больше контекст только у Gemini. Также релизнули Nova Canvas и Nova Reel, для генерации изображений и видео. Пока примеров генерации не очень, так что отпишусь про них я как-то потом. Model card
Открыть в Telegram → Открыть новость на сайте →
Аватар
В Intel серьёзные перестановки CEO Пэт Гельсингер ушёл на пенсию, а пока ищут полноценную замену, его роль будут выполнять два временных co-CEO - текущий CFO компании и глава Client Computing Group подразделения, делающего консьюмерские продукты . У компании большие проблемы: на основных рынках, где компания совсем недавно была монополистом, появились серьёзные конкуренты. Серверные процы Intel теряют свою долю рынка из-за Epyc от AMD, а Arm-процы теперь делают уже все, кому не лень - от больших клиентов, вроде Amazon, Nvidia и Google, до мелких рыбёшек вроде Ampere. С десктопными процессорами вообще ад - Intel на пару с производителями материнок настолько их разогнали, что они просто начали гореть при этом всё равно отставая от чипов AMD, жрущих в два раза меньше энергии . В ноутбучных тоже шляпа - 6 лет назад конкурентов совсем не было, а сейчас компанию душат одновременно AMD, Qualcomm и Apple. Не вышло и выйти на новые рынки - компания зачем-то сделала три поколения Gaudi, чипов для нейронок, а потом убила направление в пользу серверных видеокарт, причём когда Gaudi 3 удалось догнать H100 по производительности. С серверными видяхами тоже не очень - первое поколение, вышедшее в прошлом году, совсем не задалось, второе решили просто не выпускать, третье выйдет лишь в следующем году. Пытались они сделать и свои геймерские видеокарты, где доля, которая на старте была 2% от рынка новых видях, сейчас опустилась до 0%. Кстати, завтра презентация нового поколения геймерских видях Intel. На кошельке компании всё это отразилось крайне сильно - убытки выросли с 1,6 миллиарда во втором квартале до астрономических 16,6 миллиардов в третьем. Посмотрев на такие выдающиеся успехи, акции за последний год упали более чем в два раза. Пока не выберут нового CEO, компания в подвешенном состоянии. У 18A 18 ангстремов техпроцесса, на который Пэт поставил будущее всей компании, судя по слухам, значительные проблемы. Но даже его абсолютный успех мог не предотвратить продажу ряда подразделений, а что будет, если он провалится - страшно и подумать.
Открыть в Telegram → Открыть новость на сайте →
Аватар
Маск пообещал заделать целую ИИ игровую студию внутри xAI, как противовес "студиям во владении гигантских корпораций". У xAI, кстати, оценка 50 миллиардов, это между Electronic Arts и Nintendo. Как думаете, что из этого выйдет?
Открыть в Telegram → Открыть новость на сайте →
Аватар
Anthropic показали универсальный способ общения LLM с внешним миром MCP Model Context Protocol - открытый протокол, позволяющий любой LLM получать доступ к инструментам и информации. В качестве демо Claude попросили создать веб-страницу, залить её на GitHub, создать issue и PR, что он успешно и сделал показано на видео . Вдохновлялись LSP - протоколом, который позволил написать ядро интеграции языка с IDE один раз и использовать её повсюду, чем изменил рынок редакторов кода, дав маленьким проектам конкурировать с большими IDE. MCP работает по простой клиент-серверной архитектуре - приложения на основе LLM клиенты могут запрашивать информацию у серверов, а также пользоваться предоставленными серверами инструментами. Ещё серверы могут задавать ряд промптов. Сделать сервер довольно просто - показанный в видео сервер для GitHub написали меньше чем за час. Клиент пока что только один - Claude Desktop, а серверы нужно разворачивать своими руками локально. Потом обещают поддержку сторонних серверов - то есть в каком-то Notion будет кнопка "привязать Claude/ChatGPT/Gemini", через которую LLM будет даваться доступ к вашим данным. Выглядит это куда интереснее, чем то как пытаются сделать интеграции OpenAI и Google в ChatGPT и Gemini. Во-первых, MCP более гибкий - авторы приложений могут встраивать туда MCP-серверы. Во-вторых, открытость протокола позволит более маленьким провайдерам, вроде Mistral или DeepSeek, использовать куда больше тулов, чем если бы они пытались сделать это сами. Ну и, конечно же, это приближает эру агентов. Взлетит или не взлетит - пока ещё непонятно, но выглядит многообещающе. В качестве примеров для разработчиков Anthropic сделали 9 MCP-серверов - Slack, Google Maps, GitHub и ещё несколько. Несколько компаний уже принялись делать и сторонних клиентов - к примеру, авторы Zed и Codeium. Примеры интеграций Туториал по протоколу
Открыть в Telegram → Открыть новость на сайте →