эйай ньюз
10.06.2024 08:18
Полевой тест: Kling vs SORA Уже начали выдавать доступ к китайской модели для генерации видео Kling пост о ней первым юзерам. И в твиттере уже провели ее сравнение с моделью SORA от OpenAI. Я вижу, что SORA всё-таки генерирует более кинематографичные видео с большим количеством движения объектов и камеры. Обратите внимание, как во многих примерах камера в Kling почти статичная. Ещё, кажется, у Kling в тренировочном датасете были более простые стоковые видео, тогда как SORA тренировали на более качественных роликах. Однако, стоит учитывать, что это сравнение не совсем честное – так как мы видим примеры Kling, сгенерированные обычным юзерами, против очень сильно черепикнутых промо-видео от SORA, бог знает за сколько попыток сгенерированных. Так что ждём честного сравнения, когда у кого-то появится доступ к обеим моделям!
эйай ньюз
10.06.2024 00:24
Карпатый выпустил туториал о тренировке LLM с нуля За 4 часа он с нуля пишет GPT-Nano, при этом объясняя каждый шаг. Пока что на Python и только про претрейн, но обещает сделать туториал о создании llm.c и сделать туториал про файнтюн. Почему он учит GPT-2? Это первая LLM, с неё и началась современная эпоха. К тому же, между ламой и GPT-2 всего дюжина отличий, но GPT-2 Small можно полностью натренировать на одной GPU и сравнить свой трейнинг ран с результатами пейпера. С ламой такое не прокактит. Туториал Код #ликбез
эйай ньюз
07.06.2024 09:23
Kling – ещё одна СОРА от Китайских мастеров В Китае появляются свои собственные варианты Соры генерация видео как грибы после дождя. Недавно китайцы анонсировано Vidu, а теперь вот новая модель Kling, которая выглядит ещё лучше. Kuaishou - приложение для коротких видео, что-то типа ТикТока, как я понял. Так вот эти ребята вдруг представили свою видео модель Kling. Качество, как видите, впечатляет. Конечно, может это все черри-пики так и есть , но даже если так, то это впечатляет. Что все эти соры объединяет — так, это то, что потестировать их никому не дают интересно почему . На сайте пишут, что можно как-то потестить через их китайский апп, но там вейтлист, и я думаю, что некитайцу получить доступ шансов мало. Детали: - генерит видео до 2 минут за раз - разрешение 1080p - пишут, что за счет хорошего понимания текста может генерировать всякую необычную дичь => промпт должен хорошо понимать. Наверно, хорошо разметили датасет. - завезли поддержку разных соотношений сторон - еще отдельный инструмент для мультяшных танцулек для тиктоков Сайт какой-то лагучий, поэтому я скачал для вас все видео оттуда.
эйай ньюз
06.06.2024 14:59
Выяснилось что слитые веса были от Stable Audio Open 1.0 Stability релизнули открытую версию Stable Audio. Модель с архитектурой от Stable Audio 2, натренированная на открытых данных FreeSound и Free Music Archive . По заявлениям Stability она подходит для генерации звуковых эффектов, но с музыкой там не очень что и показал мой опыт её использования . Блогпост Веса
эйай ньюз
29.05.2024 14:50
Яндекс открыл приём заявок на международную научную премию Yandex ML Prizeх Премия вручается молодым исследователям, научным руководителям и преподавателям за достижения в области компьютерного зрения, машинного перевода, распознавания и синтеза речи, анализа данных и генеративных моделей. В этом году будет 5 номинаций: Первая публикация, Исследователи, Молодые научные руководители, Научные руководители, Преподаватели ML. Лауреаты получат денежные премии. Исследователи — по 500 тысяч рублей, научные руководители и преподаватели — по миллиону рублей. ↗ Приём заявок продлится до 21 июня, вручение премии состоится осенью. Реклама. ООО "Яндекс", ИНН 7736207543. #промо
эйай ньюз
27.05.2024 15:00
Вау, вау, вау. Microsoft официально запилил Copilot бота для Telegram. Если кто не в курсе, то это ChatGPT в интерфейсе от Microsoft. И это реально официалный бот от Microsoft – вот анонос. Я такого совсем не ожидал. Кажется, БигТехи начинают осознавать потенциал Телеграма, ну либо Бинг просто ищет любые дополнительные источники трафика. Кажется, это первое появление официального представителя компании-разработчика крупных LLM в Телеге. Пообщаться можно тут: . Он, гаденыш, правда, просит телефон верифицировать – мне такое не очень нравится.
эйай ньюз
27.05.2024 12:34
Маск привлёк в XAI инвестиций на $6 млрд в раунде B! Деньги нужны явно на GPU - если Grok-2, для тренировки, нужно 20 тысяч H100, то для Grok-3 нужно будет уже 100 тысяч. Маск думает что AGI будет доступен в течении двух лет и пытается включиться в гонку, но эстимейты Илона никогда не были особо надёжными. Ещё хочу сказать, что прошло меньше года с момента создания XAI в июле 2023, и они все это время неплохо двигаются и выкидывают модели в опенсорс. Правда, Grok-1.5V так и не релизнули. Ждём!
эйай ньюз
24.05.2024 13:00
Yandex Cloud проводит конфу по ML в бизнесе 29 мая. Говорить будут прошаренные ребята из разных индустрий о применении AI в их работе/бизнесе. Если конкретно, то поделятся своими экспериментами, внедрением генеративок и других ML-моделей. В общем, если интересно посмотреть на реальные юзкейсы этих ваших ллм и прочих нейронок, то вам сюда. Все бесплатно, но билеты не бесконечные, так что регистрацию лучше пройти прямо сейчас. #промо
эйай ньюз
14.05.2024 21:15
Провел гугл свою презентацию Google I/O Смотреть стало скучно спустя 0 секунд, начиная с речи ни о чем от Сундара Пичалька. Фото из зрительского зала прикрепляю. Показали свою новую Сору, а еще поржали сами над собой, посчитав, что сказали "AI" 121 раз. Ну это кроме Gemini 1.5 Pro, которую открыли для пользователей Advanced. Почти все презентованное будет доступно... когда-то... В целом, это был рассказ о том, как Google видит свое будущее в AI или AI будущее в себе. Gemini запихнули ну куда только можно, о чем директор каждого отдела с большой гордостью отчитался. Такое ощущение, что у них там устроили конкурс, кто больше придумает юзкейсов и интеграций в интерфейсы своих приложух. Ну а в итоге, все говорили об одном и том же. Акции GOOGL немножко приподнялись в моменте, думаю в этом и была цель — закинуть удочку на будущее для инвесторов. При всем при этом вот что я думаю: Gemini со всеми этими приколюхами может стать go-to нейронкой для обывателей, так как он торчит из всех щелей, бесплатный и бесшовно встраивается в существующие привычки пользователей. Я говорю о том, что в Chrome ты так и так зайдешь, а вот сайт OpenAI не каждый обыватель специально откроет.
эйай ньюз
14.05.2024 17:25
На сцену выпустили Демиса Хассабиса, главу Google DeepMind Он показал Gemini 1.5 Flash, более лёгкую модель, оптимизированную для низкой задержки. Версия с 1 миллионом контекста доступна всем, для 2 миллионов нужно просить доступ.