Аватар автора

ai_newz

tech

52749 Подписчиков
55 Сообщений
175 Показано сообщений
Не указана Дата добавления
ГлавнаяАвторыai_newz

Информация об авторе

Категория: tech

Последние сообщения автора

Аватар
Ого! Кто-то посмел побить Flux 1.1 Pro на text2image арене. Ребята из стартапа Recraft.ai выпустили свои модель V3, которая прям очень хорошо генерит картинки. Еще они очень круто обучились разным стилям, включая Vector Art, на котором у стартапа и был изначальный фокус. Кстати, респект ребятам, кто тренил модель! Напишите в комментах или в лс , если кто-то из вас читает канал: Потестить можно на Recraft.ai 50 бесплатных генераций
Открыть в Telegram → Открыть новость на сайте →
Аватар
Github Copilot начинает серьёзно конкурировать с Cursor На Github Universe показали новые фичи Copilot, похоже после продолжительного застоя компания всерьёз взялась за конкуренцию. Добавили поддержку новых моделей - Gemini, Claude Sonnet нужно отдельно включать в настройках и o1-preview с o1-mini. Модельки будут раскатывать в течении следующих пары недель. У меня уже есть Sonnet и o1, жду Gemini. Наконец-то добавили multi-file editing. Кастомные промпты для моделек - наконец-то в чате не нужно будет повторяться каждый раз чтобы добиться нужного результата. Вот инструкция по конфигурации. Copilot теперь доступен в Xcode и Windows Terminal. Code Review - теперь коммит можно заревьювить с помощью ИИ прямо в редакторе. Показали и Spark - платформу для создания и хостинга миниапок с помощью ИИ. Записаться в waitlist можно тут. Большая часть показаных фич уже доступна, правда некоторые лишь в превью.
Открыть в Telegram → Открыть новость на сайте →
Аватар
Google готовит к релизу Jarvis Заказать билеты на самолёт, отменить подписку или сделать какую-то мелкую монотонную работу скоро за вас сможет ИИ агент на основе Gemini. В отличие от Anthropic, которые научили Claude использовать весь компьютер, Jarvis будет ограничен браузером и как-то интегрирован с Chrome. С одной стороны это меньшая гибкость, с другой - таким образом надёжность агента будет заметно выше, что очень важно для релиза на сотни миллионов человек. Показать могут уже вместе с Gemini 2.0, в декабре. А вот попользоваться, скорее всего, сначала дадут лишь маленькой группе пользователей. Rabbit нужно было всего лишь подождать годик с релизом
Открыть в Telegram → Открыть новость на сайте →
Аватар
XAI запустили API Пока доступна только большая Grok 2. Mini-моделька есть в документации, но доступ к ней пока не дают. Ещё есть пустая секция с моделями для эмбеддингов, которая намекает на будущие релизы. Цены довольно высокие — $5 input/$15 output за миллион токенов. У всех моделей-конкурентов цены заметно дешевле дороже только o1, но Grok 2 до неё очень далеко . К тому же у конкурентов часто есть context caching и Batch API, которые помогают заметно снизить стоимость использования. Важно понимать, что это бета-продукт, который сделали 6 человек за 4 месяца. Дальше наверняка будут добавлять новые функции, больше моделек и снижать цены. Как он будет соотноситься с конкурентами через полгода - вопрос открытый.
Открыть в Telegram → Открыть новость на сайте →
Аватар
В ByteDance стажёр обиделся и два месяца саботировал тренировочные раны соседней команды, причём весьма изощрёнными методами: Загружал чекпоинты с бекдором, через который проносил скрипт, который рандомно убивал джобы на ноде ckpt - это pickle файл, они могут содержать произвольный код на питоне Специально добавлял баги в форк PyTorch, который запускался на кластере Портил чекпоинты, чтобы результаты экспериментов не сходились При всём этом он участвовал в митингах, где пытались отловить проблему, слушал, как коллеги пытаются решить её, и на основе услышанного придумывал новые способы саботажа. В итоге поймали по логам, но два месяца и усилия почти 30 человек пропали впустую. А у вас что-то такое было? П.с. кроме шуток, мощный чел оказался.
Открыть в Telegram → Открыть новость на сайте →
Аватар
Mistral выпустили линейку новых моделей - Ministral. Идут в двух размерах - 3B и 8B. Слегка лучше Llama 3.1 в тех же весовых категориях. К сожалению, публикуют веса лишь большой модели и только под research-only лицензией. Понятно что компании нужно кормить, но всё равно грустно. Бенчами как всегда манипулируют, так что даже не буду постить таблички. К примеру, Base модель вообще не сравнивают с Gemma 9B PT, которая на 5+ поинтов обгоняет Ministral 8B Base почти на всех бенчах. Из приятного - заметьте как разгорается соревнование в 3B моделях. Сначала это была лишь StableLM, а сейчас есть уж несколько конкурирующих моделей Gemini Nano-2, Llama 3.2, StableLM, Apple Intelligence, Phi и постоянно выходят новые.
Открыть в Telegram → Открыть новость на сайте →
Аватар
Уже вторая Нобелевская премия за AI — на этот раз по химии. Половина премии за предсказание структуры белков» нейросетью Alpha Fold от DeepMind Нобелевскую премию по химии 2024 года: одну половину — Дэвиду Бейкеру «за вычислительный дизайн белков», а другую половину — совместно Демису Хассабису и Джону М. Джамперу «за предсказание структуры белков».
Открыть в Telegram → Открыть новость на сайте →
Аватар
OpenAI привлекла 6,6 млрд долларов при оценке в 157 млрд долларов Последние несколько недель факт привлечения инвестиций был секретом Полишинеля — все знали, кто, примерно сколько и по какой оценке инвестирует. И вот сразу после DevDay 2024 OpenAI закрыла этот раунд финансирования. Оценка в 157 миллиардов долларов, похоже, делает их дороже всех независимых конкурентов вместе взятых — Anthropic собирается поднимать следующий раунд по оценке в 40 млрд, XAI недавно привлекла 6 миллиардов при оценке в 24, а Mistral за эти 6,6 млрд можно вообще купить с потрохами. Компаний поменьше на почти 90 миллиардов вряд ли наберётся. Деньги привлекаются конвертируемыми облигациями — долгом, который при желании кредитора конвертируется в акции компании. Но они идут с условиями — в течение двух лет компания должна реструктурироваться и стать коммерческой, иначе вступают в силу штрафные санкции. Но и у OpenAI есть свои условия — инвесторы в OpenAI не должны инвестировать в конкурентов. Диктуют они их не просто так — компания растёт бешеными темпами и, похоже, утроит свою прогнозируемую выручку с 3,6 миллиардов до 11,6 миллиардов в год к концу 2025 года. Часть плана по росту выручки — повышение цен на ChatGPT, основной драйвер роста компании. В этом году цена вырастет до 22 долларов, а до конца 2029 года она более чем удвоится — до 44 долларов. А про цены на GPT-5 и думать страшно.
Открыть в Telegram → Открыть новость на сайте →
Аватар
Cerebras, стартап, занимающийся чипами для нейронок, собирается выходить на биржу Месяц назад писал о сверхбыстром инференсе Cerebras в канале. А тут подъехала внутренняя кухня - ведь перед IPO компании нужно опубликовать финансовую отчётность S-1 form . И там всё очень грустно. Оказалось, что у компании всего один крупный клиент - 97% выручки с продажи железа и 56% остальной выручки идёт от него. То есть суммарно 87% выручки компании идут от G42 - клауд-провайдера из ОАЭ. До появления большого папочки у компании все было довольно плохо - судя по выручке, за весь 2022 год стартап продал около 10 своих машин, а за первую половину 2023 - всего одну. Позже в 2023 компания нашла своего основного клиента и ситуация поправилась, но терять по сто с лишним миллионов в год от этого она не перестала. При таких маленьких объёмах производства не удивительно, что они не предоставляют инференс Llama 405B - у компании просто может не быть необходимой пары десятков свободных машин на руках. А будущие модели будут только больше, так что будущее их инференса под большим вопросом. Учитывая, что компании уже больше восьми лет, - всё это вряд ли взлетит и для тренировки. Крупным клиентам нужны кластеры на сотни и тысячи таких машин, которые компания вряд ли может произвести в разумные сроки. А заказы поменьше не оправдают огромные инвестиции в софт, которые нужны для перехода на такую архитектуру. Так что возможности тренировки на двух тысячах CS-3, скорее всего, навсегда останутся инфографикой, а Хуанг - королём. А жаль, у них интересная архитектура. Может быть, я про неё напишу на днях.
Открыть в Telegram → Открыть новость на сайте →
Аватар
Губернатор Калифорнии наложил вето на SB-1047 В последний момент Гэвин Ньюсом всё-таки решил воспользоваться своим правом вето. Я писал про этот законопроект и разбирал что с ним не так несколько раз. Изначально там был полнейший бред, который мог убить калифорнийский опенсорс на корню. Его частично поправили, но даже в последних редакциях в законопроекте была куча расплывчатых определений, плюс он делал разработчиков изначальной модели ответственными за действия большинства файнтюнов. Губернатор обещает внести свой собственный законопроект уже в следующем году. Надеюсь он будет более адекватным, по крайней мере эта часть текста вето даёт надежду: Хотя законопроект SB 1047 создан с благими намерениями, он не учитывает, используется ли система ИИ в высокорискованных средах, связана ли она с принятием критически важных решений или обработкой конфиденциальных данных. Вместо этого законопроект предъявляет строгие требования даже к самым базовым функциям — если это делает крупная система. Я не считаю, что это наилучший подход к защите общественности от реальных угроз, создаваемых этой технологией. Регулирование конкретных применений ИИ вместо использования странных критериев с произвольными лимитами по компьюту звучит как гораздо более правильный подход. Ждём следующего законопроекта и надеемся на отсутствие там угрожающей опенсорсу шизы. Текст вето
Открыть в Telegram → Открыть новость на сайте →