Запуск нейросети Grok 4 от xAI: Прорыв в AGI и лидерство в тестах

Рестарт

Илон Маск выкатил монстра — вышла нейронка Grok 4, которая меняет правила. Это не просто улучшение — это скачок в сторону настоящего AGI. Что умеет: — Предсказывает события — показала точный прогноз спортивного чемпионата, используя только данные и контекст. — Формулирует новые рабочие гипотезы по физике, пригодные для применения в инженерных проектах. — Прошла 44,4% «финального» AGI-теста, до которого большинство моделей даже не доходят. — Закрывает 100% задач по высшей математике — буквально нечего поставить в пример, чего она бы не решила. Релиз уже сегодня. Ждем имбу — здесь.

Технологии309 дней назад

эйай ньюз

Вышел Grok 4 SOTA на нескольких бенчах — выбивает идеальный результат на AIME25. Результаты на ARC-AGI-2 почти в два раза выше чем у прошлого лидера — Claude 4 Opus, 15.9% против 8,6%. Но больше всего xAI гордятся Humanity s Last Exam, которому посвятили почти половину презентации. Результаты и правда хорошие — с максимальным компьютом и с доступом к инструментам модель выдаёт 44,4% 50.7% на текстовой части . Без тулюза всё ещё SOTA, но с меньшим отрывом — модель выбивает 25.4%, против 21.6% у Gemini 2.5 Pro. Базовая модель та же самая что у Grok 3 Grok 4 изначально хотели запустить как Grok 3.5, но решили потренировать подольше . Основное отличие — на тренировку ризонингу потрачено в 10x больше компьюта. Теперь компьют на RL примерно равен компьюту на претрейн, с чем я вас и поздравляю . Что важно — модель теперь нативно учат тулюзу во время RL, как и o3 с o4-mini. С мультимодальностью всё не очень — бенчмарки показали почти исключительно текстовые, а на HLE видна заметная просадка. Илон это обещает поправить уже со следующей версией базовой модели. А вот контекст удвоили до 256k. Запустили и API, цена за токен такая же как у Grok 3 и Claude Sonnet, но модель очень разговорчивая — на реальных задачах она стоит почти как Claude Opus 4. Grok 4 Mini не состоялся, а жаль — Grok 3 Mini крайне хорошая модель за свою цену, хотелось бы апдейта. А тем временем компьют xAI расширяется с неслыханными темпами — Илон говорит что они собираются начать тренировку своей видеомодели на 100k+ GB200 через 3-4 недели. Уже есть деньги и на следующее расширение Colossus — в конце прошлого месяца компания привлекла 10 миллиардов долларов. Половину от инвесторов, а половину — в долг.

Технологии309 дней назад

DeFi News

Компания xAI Илона Маска официально запустила Grok 4 — новую версию ИИ с улучшенным мышлением, поддержкой кода и «anti-woke» подходом. Что он умеет: Предсказывает события — показала точный прогноз спортивного чемпионата, используя только данные и контекст. Формулирует новые рабочие гипотезы по физике, пригодные для применения в инженерных проектах. Прошла 44.4% «финального» AGI-теста, до которого большинство моделей даже не доходят. Закрывает 100% задач по высшей математике — буквально нечего поставить в пример, чего она бы не решила. Доступна бесплатно для подписчиков X Premium+. Новости криптовалют

Технологии305 дней назад

Bard AI | Нейросети & IT

Grok 4 от xAI вышел — теперь это №1 среди LLM По первым тестам Grok 4 лидирует в главном индексе интеллекта Artificial Analysis 73% , обогнав OpenAI o3 и Gemini 2.5 Pro оба по 70% . В математике и кодинге тоже уверенный отрыв. Попутно побил рекорды в GPQA и Humanity’s Last Exam. Контекст модели — 256k токенов, есть поддержка изображений, структурированных ответов, вызова функций и других приятных штук Цены выше, чем у Gemini 2.5 Pro и o3, но дешевле, чем o3-pro и Claude 4 Opus. API уже доступен Сегодня выкатывают сразу две версии: стандартный Grok и Grok Heavy за который придётся отваливать $300 в месяц

Технологии309 дней назад

Диджитальная

Компания xAI Илона Маска официально запустила Grok 4 — новую версию ИИ с улучшенным мышлением, поддержкой кода и «anti-woke» подходом. Что он умеет: - Предсказывает события — показала точный прогноз спортивного чемпионата, используя только данные и контекст. - Формулирует новые рабочие гипотезы по физике, пригодные для применения в инженерных проектах. - Прошла 44.4% «финального» AGI-теста, до которого большинство моделей даже не доходят. - Закрывает 100% задач по высшей математике — буквально нечего поставить в пример, чего она бы не решила. Доступна бесплатно для подписчиков X Premium+.

Технологии309 дней назад

BelVestnik

Grok 4 от xAI — новый лидер в мире ИИ Сегодня, 9 июля 2025 года, xAI представила Grok 4 — самую мощную модель ИИ на сегодня. Она обходит GPT-4o, Gemini 2.5 Pro и Claude 4 Opus в тестах по логике, математике и анализу данных. Что умеет Grok 4? Решает задачи уровня PhD и прогнозирует события например, исход Мировой серии бейсбола . Программирует как профи с Grok 4 Code — автодополнение и отладка в реальном времени. Скоро: обработка изображений и генерация видео. Доступен через X для Premium+ , iOS/Android и API. Цена: от $30/мес, премиум SuperGrok Heavy — $300/мес. В ЕС и UK пока недоступен из-за регуляций. Grok 4 обещает открыть новые технологии уже в 2025 году. Ждем.

Технологии309 дней назад

БлоGнот

xAI впервые вышла в лидеры рынка ИИ — Grok 4 набрал 73 балла в Intelligence Index, опередив o3 70 , Gemini 2.5 Pro 70 и Claude 4 Opus 64 . Это первый случай, когда модель не из "большой тройки" OpenAI, Google, Anthropic занимает первое место в комплексном рейтинге Artificial Analysis. Grok 4 показал рекордные 88% в GPQA Diamond и 94% в AIME 2024. Это reasoning-модель, которая "думает" перед ответом, хотя сами токены рассуждений через API не передаются. Цена $3/$15 за миллион входящих/исходящих токенов идентична Claude 4 Sonnet, но выше чем у Gemini 2.5 Pro $1.25/$10 и o3 $2/$8 . Скорость 75 токенов в секунду уступает o3 188 и Gemini 2.5 Pro 142 , но опережает Claude 4 Opus Thinking 66 . Контекстное окно 256K токенов — меньше чем у Gemini 2.5 Pro 1M , но больше чем у конкурентов 200K у Claude и o3, 128K у R1 . Поддерживает текст, изображения, вызовы функций и структурированные выходы. Правда, Маск прямо на презентации признал, что модель пока плохо справляется с мультимодальным режимом, но это будет исправлено в будущем.

Технологии309 дней назад

Запуск нейросети Grok 4 от xAI: Прорыв в AGI и лидерство в тестах

Источники

Сотрудники крупных компаний используют ИИ для накрутки внутренних метрик

Threads запускает ИИ-бота Meta AI в пяти странах, пользователи выражают недовольство

Конференция AI2Business и прием докладов на Saint HighLoad 2026: внедрение ИИ в бизнес и разработку

OpenAI интегрировала Codex в мобильное приложение ChatGPT

Роботы Helix 02 от Figure AI успешно отработали 8-часовую смену на производственной линии

Исследование показывает растущее применение ИИ в России среди специалистов и ученых

Запуск нейросети Grok 4 от xAI: Прорыв в AGI и лидерство в тестах

Ещё по теме

Источники

Сотрудники крупных компаний используют ИИ для накрутки внутренних метрик

Threads запускает ИИ-бота Meta AI в пяти странах, пользователи выражают недовольство

Конференция AI2Business и прием докладов на Saint HighLoad 2026: внедрение ИИ в бизнес и разработку

OpenAI интегрировала Codex в мобильное приложение ChatGPT

Роботы Helix 02 от Figure AI успешно отработали 8-часовую смену на производственной линии

Исследование показывает растущее применение ИИ в России среди специалистов и ученых