ai_newz

эйай ньюз

10.07.2025 06:16

Вышел Grok 4 SOTA на нескольких бенчах — выбивает идеальный результат на AIME25. Результаты на ARC-AGI-2 почти в два раза выше чем у прошлого лидера — Claude 4 Opus, 15.9% против 8,6%. Но больше всего xAI гордятся Humanity s Last Exam, которому посвятили почти половину презентации. Результаты и правда хорошие — с максимальным компьютом и с доступом к инструментам модель выдаёт 44,4% 50.7% на текстовой части . Без тулюза всё ещё SOTA, но с меньшим отрывом — модель выбивает 25.4%, против 21.6% у Gemini 2.5 Pro. Базовая модель та же самая что у Grok 3 Grok 4 изначально хотели запустить как Grok 3.5, но решили потренировать подольше . Основное отличие — на тренировку ризонингу потрачено в 10x больше компьюта. Теперь компьют на RL примерно равен компьюту на претрейн, с чем я вас и поздравляю . Что важно — модель теперь нативно учат тулюзу во время RL, как и o3 с o4-mini. С мультимодальностью всё не очень — бенчмарки показали почти исключительно текстовые, а на HLE видна заметная просадка. Илон это обещает поправить уже со следующей версией базовой модели. А вот контекст удвоили до 256k. Запустили и API, цена за токен такая же как у Grok 3 и Claude Sonnet, но модель очень разговорчивая — на реальных задачах она стоит почти как Claude Opus 4. Grok 4 Mini не состоялся, а жаль — Grok 3 Mini крайне хорошая модель за свою цену, хотелось бы апдейта. А тем временем компьют xAI расширяется с неслыханными темпами — Илон говорит что они собираются начать тренировку своей видеомодели на 100k+ GB200 через 3-4 недели. Уже есть деньги и на следующее расширение Colossus — в конце прошлого месяца компания привлекла 10 миллиардов долларов. Половину от инвесторов, а половину — в долг.

Открыть в Telegram → Открыть новость на сайте →

эйай ньюз

27.06.2025 14:26

Cloud.ru анонсировал AI-помощника для автоматизации работы с облаком На конференции GigaConf провайдер облачных и AI-технологий Cloud.ru сделал два анонса: запуск AI-помощника Клаудии и открытие общего доступа к платформе Cloud.ru Evolution AI Factory. Инструменты упрощают работу с облачными технологиями и AI для пользователей со всеми уровнями технического бэкграунда. AI-помощник в режиме Public Preview консультирует пользователей и выполняет конкретные действия по управлению ресурсами. Он самостоятельно разворачивает виртуальные машины, подбирает оптимальную конфигурацию сервисов, настраивает мониторинг и алертинг, а также работает с консолью в режиме co-pilot. Зная архитектуру платформы, помощник дает персональные рекомендации и автоматизирует рутинные DevOps-задачи. Эти инструменты помогут разработчикам стартапов и pet-проектов без особого опыта в облачных технологиях быстрее запускать проекты, а опытным DevOps и SRE-инженерам — сосредоточиться на стратегических задачах. Также провайдер открыл доступ к Cloud.ru Evolution AI Factory — облачной среде с готовыми инструментами для работы с LLM и создания мультиагентных систем. В нее входят шесть сервисов: Foundation Models для работы с моделями через API, ML Inference для развертывания моделей, Managed RAG для технологии дополненной генерации, ML Finetuning для адаптации LLM-моделей, Notebooks для работы с Jupyter Notebooks и AI Agents — визуальный редактор агентов на базе LLM. Инструменты подходят для разных задач: от автоматизации поддержки клиентов до оптимизации документооборота и управления поставками. #промо

Открыть в Telegram → Открыть новость на сайте →

эйай ньюз

18.06.2025 20:01

Midjourney запустили видеомодель - V1 Доступно всем подписчикам начиная с 10 долларов. Разрешение пока 480p и всего 5 секунд генерации, возможно это для изначального запуска чтобы сервера не поплавились, но позволяют догенеривать следующие сегменты. Выдаёт по 4 видоса на промпт как и обычная миджорни для генерации картинок да и генерит быстро. Красиво, без артефактов, но сильно хорошей симуляции нет. Компания долго шла к видео — почти два года. Почему так много времени — генерация видео это очень дорогое удовольствие, а Midjourney зависит лишь от своей выручки и никогда не брала сторонних инвестиций. Анонс

Открыть в Telegram → Открыть новость на сайте →

эйай ньюз

10.06.2025 20:27

OpenAI релизнули o3 pro Доступ к модели уже дают Pro подписчикам и в API. Модель заметно дешевле o1 pro — $20/$80 за миллион токенов, по сравнению с $150/$600 у o1 pro. Одновременно с этим в 5 раз снизили цену на обычную o3 — теперь она стоит $2/$8 за миллион токенов. То есть o3 pro ровно в 10 раз дороже.

Открыть в Telegram → Открыть новость на сайте →

эйай ньюз

05.06.2025 16:21

Gemini 2.5 Pro обновили Сильный прирост по бенчам, Gemini 2.5 Pro теперь обходит текущую версию o3. Модель уже доступна в ai.studio, по первым ощущениям мне она нравится больше чем более ранние версии — по крайней мере она слушается когда просишь её не спамить код комментами. А ещё, как и 2.5 Flash, это гибридная модель, у которой можно как устанавливать бюджет на ризонинг, так и вырубить его полностью. Генерацию изображений для Gemini Pro так и не завезли.

Открыть в Telegram → Открыть новость на сайте →

эйай ньюз

03.06.2025 18:24

OpenAI дают доступ к Codex подписчикам Plus Доступ уже раскатывают, лимиты "щедрые", но во время высокой нагрузки их будут резать для Plus юзеров. Ещё докинули кучу quality of life фич — агенту теперь можно давать указания голосом и включить доступ к интернету. Плюс Codex теперь не будет спамить пулреквестами, а сможет обновлять существующие. chatgpt.com/codex

Открыть в Telegram → Открыть новость на сайте →

эйай ньюз

22.05.2025 16:34

Anthropic только что релизнули Claude 4 Sonnet и Opus Модели концентрируются на кодинге и агентах — там они SOTA, в остальных бенчах всё более спорно. Новый клод может заниматься задачей в течении многих часов не сбиваясь, по заявлениям сотрудников Anthropic. Этого хватает для куда более сложных задач, чем те на которые способны другие модели. Цены остаются от старых Sonnet и Opus. Вместе с моделью анонсировали кучу фич для разработчиков: В API сегодня запустят code execution tool. Прямая интеграция Claude в IDE JetBrains и VS Code. К Claude в API теперь можно напрямую подключаться через MCP. В API добавили Files API и веб поиск. Prompt Caching теперь можно расширить до часа. Блогпост

Открыть в Telegram → Открыть новость на сайте →

эйай ньюз

21.05.2025 14:39

Devstral 24B — лучшая открытая агентная модель для кодинга Mistral AI и All Hands AI представили Devstral — специализированную LLM для реальных задач в кодинге, с 46.8% на SWE-Bench Verified, что делает её на 6% выше лучших открытых моделей. Это всё несмотря на малый размер — модель влезает в 3090 или Mac с 32 гигами оперативки. Модель работает через агентные фреймворки одна из компаний всё же авторы OpenHands для взаимодействия с кодбазами. Вероятно её хорошо научили пользоваться скафолдингом, из-за чего такие хорошие результаты, даже без ризонинга. Модель доступна по лицензии Apache 2.0, то есть её спокойно можно использовать в коммерческих целях. Через пару недель обещают модели побольше, но вряд ли настолько же открытые. Веса Блогпост

Открыть в Telegram → Открыть новость на сайте →

эйай ньюз

20.05.2025 18:26

Veo 3 — новая лучша модель для генерации видео Похоже, новая SOTA для видео. Кроме видео может генерить ещё и звуки, в том числе и диалоги! Все видосы в посте были сгенерены чисто через Veo 3. Будет доступна уже сегодня.

Открыть в Telegram → Открыть новость на сайте →

эйай ньюз

16.05.2025 15:43

Codex — агент для кодинга от OpenAI Внутри модель codex-1, версия o3 для агентного кодинга. Она генерирует код, близкий к человеческому стилю, точно следует инструкциям и может итеративно запускать тесты до получения положительного результата. codex-1 будет доступна лишь в специальном огороженном энвайрнменте от OpenAI. Но есть и версия поменьше — codex-mini, основанная на o4-mini. Она будет доступна в API по цене $1.5/$6 за миллион токенов. В Codex CLI, которая работает на вашем компьютере доступна будет лишь codex-mini. Но теперь можно заходить с аккаунтом ChatGPT, а Plus и Pro пользователям ещё и дают бесплатных API кредитов для codex-mini на 30 дней — $5 и $50. Акция, надеюсь, не разовая. Доступ к полноценному Codex осуществляется через ChatGPT, куда теперь можно подключать свои гитхаб репозитории, в которых Codex будет открывать пулреквесты. Codex даёт подтверждения своих действий логи, результаты тестов , его работу можно направлять файлами AGENTS.md, а безопасность обеспечивается исполнением кода в изолированном контейнере и отказом от выполнения вредоносных запросов. Доступен будет уже сегодня для Pro, Team и Enterprise пользователей, а Plus и Edu нужно подождать. А ещё они опубликовали системный промпт Блогпост Попробовать только Pro, Team и Enterprise подпискам

Открыть в Telegram → Открыть новость на сайте →

Информация об авторе

Последние сообщения автора