data_secrets

Data Secrets

15.08.2025 05:38

Google выпустили Gemma 3 270М – одну из самых компактных моделей индустрии Да, именно 270M, а не B. Совсем кроха, которую запустить действительно можно чуть ли не на утюге. Она и создана специально для этого, и даже оптимизирована с точки зрения энергоэффективности: в INT4 квантизации на Pixel 9 Pro съедает всего 0.75% батареи за 25 диалогов. И кстати, для такого размера очень неплохие показатели следования инструкциям: на IF-Eval 51.2%. По этому показателю модель обходит даже Qwen 2.5 0.5В, который почти в два раза больше. Для чего использовать: 1. Конечно, локальный запуск. Для кода не подойдет, но для генерации простого текста сгодится. 2. Быстрое простое дообучение под вашу задачу например, под entity extraction или какой-нибудь sentiment-анализ подойдет отлично . 3. Edge/Internet of Things. Модельку реально можно встроить в колонку, чайник или холодильник и развлекаться Отличная штука для экспериментов, в общем Веса

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

14.08.2025 16:35

Игорь Бабушкин, сооснователь xAI и один из главных архитекторов команды, объявил об уходе из компании Бывший инженер DeepMind и OpenAI а теперь уже и xAI запускает фонд Babuschkin Ventures . Задача — инвестировать в проекты по AI-safety и агентные системы, которые, по его словам, «помогут продвигать человечество и раскрывать тайны Вселенной». В прощальном посте он выделил два принципа, которым научился у Маска: лично вникать в технические задачи и работать с маниакальным чувством срочности. Для xAI это уже третья заметная потеря топ-кадров за последние месяцы — на фоне жёсткой конкуренции с OpenAI, Google и Anthropic такие новости явно не добавляют спокойствия Илону

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

13.08.2025 13:53

Ну мем: сразу после того, как Хуанг согласился отстегивать правительству США 15% прибыли на лицензию за продажу в Китае, китайское правительство решило, что они больше не хотят покупать видеокарты Nvidia Они распорядились крупнейшим местным технологическим компаниям – ByteDance, Alibaba и Tencent – приостановить закупки чипов Nvidia, в первую очередь модели H20 той самой, на которую Дженсен так выбивал лицензию . Все из-за опасений по поводу национальной безопасности и угроз информационной безопасности. Помните же историю, когда некие американские исследователи распустили сплетню о том, что Nvidia зашивает в свои китайские чипы локаторы и устройства удаленного управления? Так вот хоть это был и фейк, в Китае все-таки не на шутку разволновались по этому поводу. Сюжет для сериала, и только

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

13.08.2025 06:27

Маленький информативный пост: Сэм Альтман поделился двумя апдейтами для GPT-5 1. Теперь можно выбирать между “Auto”, “Fast” и “Thinking” режимом для GPT-5. Смысл каждого мода, вероятно, понятен. Полезнее всего все равно может оказаться Auto, но как дополнительный элемент управления – норм. 2. Всем платным пользователям вернули старые модели! 4o вернулась в основное меню выбора моделей, а o3, 4.1 и GPT-5-thinking-mini можно найти в подразделе «Show additional models». GPT-4.5 очень прожорливая, поэтому ее оставили только в Pro. Ну а про обновление лимитов вы уже знаете. Еще Сэм пишет, что они продолжают работать над «личностью» модели видимо калибруют системный промпт . В скором времени GPT-5 должна стать чуть добродушнее.

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

12.08.2025 11:44

У MWS Cloud появилась своя платформа для эксплуатации моделей ИИ - Inference Valve Она может работать с ML-моделями и большими языковыми моделями, выводя их в продакшн. Платформа позволит подключить их к IT-системам компании даже через стандартные API, масштабировать и обновлять. Inference Valve помогает автоматизировать рутину: операционная нагрузка на команды снижается до 70%. Затраты на GPU снижаются на 15%. С помощью платформы CV-модели могут анализировать видео, искать в них объекты, сцены или действия. ML- и LLM-модели - генерировать тексты, анализировать данные и отвечать на часто задаваемые вопросы в HR-порталах.

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

12.08.2025 06:41

xAI подает в суд на Apple Причина занятная: по мнению Маска, «Apple ведет себя таким образом, что ни одна компания в сфере ИИ, кроме OpenAI, не может занять первое место в App Store, и это нарушает антимонопольное законодательство». Пруфов, естественно, пока никаких. Где-то тяжело вздохнул один Тим Кук

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

11.08.2025 15:05

Ну все, это кульминация: Nvidia и AMD будут платить Америке за то, чтобы продавать чипы в Китае Компании пошли на беспрецедентное соглашение с правительством США. Согласно условиям сделки, они обязаны перечислять американским властям 15% своей выручки от продаж в Китае в обмен на получение экспортных лицензий. Причем даже это – не для любых чипов, а для H20. Они специально были разработаны для китайского рынка и отличаются немного пониженными вычислительной мощностью и коммуникационной способностью. Их запретили к поставке в апреле, но теперь лицензии снова будут выдавать, но уже за очень жирный процент. Кажется, это и был план Белого дома с самого начала. За деньги – да

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

09.08.2025 08:51

Так, Сэм Альтман собрал фидбэк о GPT-5 от пользователей в AMA на Reddit и вот несколько хороших новостей: 1. Вчера система не забываем, что это именно система, а не одна модель казалась глупее, потому что сломался роутинг между моделями. Теперь все починили, по идее должно стать поприятнее. 2. Информация о том, какая модель работает над запросом, станет прозрачнее: видимо, будет отображаться где-то перед аутпутом. Плюс разработчики до сих пор калибруют границу принятия решения о переключении моделей. Также можно будет вручную переключаться в режим ризонинга. 3. После того, как GPT-5 наконец докатят на всех, лимиты для Plus пользователей удвоятся. Также OpenAI рассматривают возможность разрешить Plus юзерам продолжать использовать GPT-4o. Об этом попросило прямо ооочень много людей.

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

18.11.2024 15:43

У o1 появился опенсорс-конкурент: китайские исследователи выпустили LLaVA-o1 Ресерчеры утверждают, что им удалось добиться ризонинга, аналогичного модели OpenAI, и при этом их модель еще и мультимодальная. Она имеет всего 11В параметров и на усредненных бенчмарках заметно превосходит Gemini Pro 1.5, Llama-3.2V 90B и даже GPT-4o-mini. В основе лежит Llama-3.2-11B-Vision-Instruct, которую файнтюнили всего на 100к обучающих сэмплов но не простых . Ключом к SOTA ученые называют новый метод inference time скейлинга и специальное структурирование данных. Весь трейн состоял из синтетики, сгенерированной с помощью GPT-4o и поделенной тегами <SUMMARY>, <CAPTION>, <REASONING> и <CONCLUSION>. Благодаря такому строению модель тоже учится добавлять эти теги в свои ответы и начинает рассуждать поэтапно . Что касается инференса, то здесь исследователи предлагают аналог поиска по лучу. Только анализ тут происходит на уровне этапов тегов . То есть модель генерирует несколько вариантов ответов для каждого тега, но для перехода на следующий этап отбирается только один из них, на основе которого затем модель и продолжает семлировать токены для следующего тега. Посмотрим, что будет на арене, а пока вот ссылка на саму статью и на гитхаб

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

18.11.2024 08:51

А вот, кажется, и первые продукты на основе Realtime API OpenAI: в сети набирает популярность проект одного британского оператора связи, создавшего ИИ-бабушку для телефонных разговоров с мошенниками Бабуля зависает на линии с отловленными звонками мошенников и начинает пудрить им мозги разговорами про котят, вязание, сад-огород. А когда те просят какие-то реквизиты, может их либо выдумать, либо начать «не понимать» собеседника и задавать миллион вопросов. В Великобритании такую пенсионерку уже можно подключить себе в качестве сервиса: разработчики утверждают, что она может задерживать мошенников на линии до 40 минут Сами создатели говорят, что система «объединяет несколько моделей». Может и так, но в демо интонации слишком живые и задержка слишком мала, так что если это не черрипикинг, то все же больше похоже на 4o.

Открыть в Telegram → Открыть новость на сайте →

Информация об авторе

Последние сообщения автора