10 июля, 09:03
Запуск нейросети Grok 4 от xAI: Прорыв в AGI и лидерство в тестах


Рестарт
Илон Маск выкатил монстра — вышла нейронка Grok 4, которая меняет правила. Это не просто улучшение — это скачок в сторону настоящего AGI. Что умеет: — Предсказывает события — показала точный прогноз спортивного чемпионата, используя только данные и контекст. — Формулирует новые рабочие гипотезы по физике, пригодные для применения в инженерных проектах. — Прошла 44,4% «финального» AGI-теста, до которого большинство моделей даже не доходят. — Закрывает 100% задач по высшей математике — буквально нечего поставить в пример, чего она бы не решила. Релиз уже сегодня. Ждем имбу — здесь.
Технологии78 дней назад


эйай ньюз
Вышел Grok 4 SOTA на нескольких бенчах — выбивает идеальный результат на AIME25. Результаты на ARC-AGI-2 почти в два раза выше чем у прошлого лидера — Claude 4 Opus, 15.9% против 8,6%. Но больше всего xAI гордятся Humanity s Last Exam, которому посвятили почти половину презентации. Результаты и правда хорошие — с максимальным компьютом и с доступом к инструментам модель выдаёт 44,4% 50.7% на текстовой части . Без тулюза всё ещё SOTA, но с меньшим отрывом — модель выбивает 25.4%, против 21.6% у Gemini 2.5 Pro. Базовая модель та же самая что у Grok 3 Grok 4 изначально хотели запустить как Grok 3.5, но решили потренировать подольше . Основное отличие — на тренировку ризонингу потрачено в 10x больше компьюта. Теперь компьют на RL примерно равен компьюту на претрейн, с чем я вас и поздравляю . Что важно — модель теперь нативно учат тулюзу во время RL, как и o3 с o4-mini. С мультимодальностью всё не очень — бенчмарки показали почти исключительно текстовые, а на HLE видна заметная просадка. Илон это обещает поправить уже со следующей версией базовой модели. А вот контекст удвоили до 256k. Запустили и API, цена за токен такая же как у Grok 3 и Claude Sonnet, но модель очень разговорчивая — на реальных задачах она стоит почти как Claude Opus 4. Grok 4 Mini не состоялся, а жаль — Grok 3 Mini крайне хорошая модель за свою цену, хотелось бы апдейта. А тем временем компьют xAI расширяется с неслыханными темпами — Илон говорит что они собираются начать тренировку своей видеомодели на 100k+ GB200 через 3-4 недели. Уже есть деньги и на следующее расширение Colossus — в конце прошлого месяца компания привлекла 10 миллиардов долларов. Половину от инвесторов, а половину — в долг.
Технологии78 дней назад

DeFi News
Компания xAI Илона Маска официально запустила Grok 4 — новую версию ИИ с улучшенным мышлением, поддержкой кода и «anti-woke» подходом. Что он умеет: Предсказывает события — показала точный прогноз спортивного чемпионата, используя только данные и контекст. Формулирует новые рабочие гипотезы по физике, пригодные для применения в инженерных проектах. Прошла 44.4% «финального» AGI-теста, до которого большинство моделей даже не доходят. Закрывает 100% задач по высшей математике — буквально нечего поставить в пример, чего она бы не решила. Доступна бесплатно для подписчиков X Premium+. Новости криптовалют
Технологии73 дня назад


Bard AI | Нейросети & IT
Grok 4 от xAI вышел — теперь это №1 среди LLM По первым тестам Grok 4 лидирует в главном индексе интеллекта Artificial Analysis 73% , обогнав OpenAI o3 и Gemini 2.5 Pro оба по 70% . В математике и кодинге тоже уверенный отрыв. Попутно побил рекорды в GPQA и Humanity’s Last Exam. Контекст модели — 256k токенов, есть поддержка изображений, структурированных ответов, вызова функций и других приятных штук Цены выше, чем у Gemini 2.5 Pro и o3, но дешевле, чем o3-pro и Claude 4 Opus. API уже доступен Сегодня выкатывают сразу две версии: стандартный Grok и Grok Heavy за который придётся отваливать $300 в месяц
Технологии78 дней назад

Диджитальная
Компания xAI Илона Маска официально запустила Grok 4 — новую версию ИИ с улучшенным мышлением, поддержкой кода и «anti-woke» подходом. Что он умеет: - Предсказывает события — показала точный прогноз спортивного чемпионата, используя только данные и контекст. - Формулирует новые рабочие гипотезы по физике, пригодные для применения в инженерных проектах. - Прошла 44.4% «финального» AGI-теста, до которого большинство моделей даже не доходят. - Закрывает 100% задач по высшей математике — буквально нечего поставить в пример, чего она бы не решила. Доступна бесплатно для подписчиков X Premium+.
Технологии78 дней назад


BelVestnik
Grok 4 от xAI — новый лидер в мире ИИ Сегодня, 9 июля 2025 года, xAI представила Grok 4 — самую мощную модель ИИ на сегодня. Она обходит GPT-4o, Gemini 2.5 Pro и Claude 4 Opus в тестах по логике, математике и анализу данных. Что умеет Grok 4? Решает задачи уровня PhD и прогнозирует события например, исход Мировой серии бейсбола . Программирует как профи с Grok 4 Code — автодополнение и отладка в реальном времени. Скоро: обработка изображений и генерация видео. Доступен через X для Premium+ , iOS/Android и API. Цена: от $30/мес, премиум SuperGrok Heavy — $300/мес. В ЕС и UK пока недоступен из-за регуляций. Grok 4 обещает открыть новые технологии уже в 2025 году. Ждем.
Технологии77 дней назад

БлоGнот
xAI впервые вышла в лидеры рынка ИИ — Grok 4 набрал 73 балла в Intelligence Index, опередив o3 70 , Gemini 2.5 Pro 70 и Claude 4 Opus 64 . Это первый случай, когда модель не из "большой тройки" OpenAI, Google, Anthropic занимает первое место в комплексном рейтинге Artificial Analysis. Grok 4 показал рекордные 88% в GPQA Diamond и 94% в AIME 2024. Это reasoning-модель, которая "думает" перед ответом, хотя сами токены рассуждений через API не передаются. Цена $3/$15 за миллион входящих/исходящих токенов идентична Claude 4 Sonnet, но выше чем у Gemini 2.5 Pro $1.25/$10 и o3 $2/$8 . Скорость 75 токенов в секунду уступает o3 188 и Gemini 2.5 Pro 142 , но опережает Claude 4 Opus Thinking 66 . Контекстное окно 256K токенов — меньше чем у Gemini 2.5 Pro 1M , но больше чем у конкурентов 200K у Claude и o3, 128K у R1 . Поддерживает текст, изображения, вызовы функций и структурированные выходы. Правда, Маск прямо на презентации признал, что модель пока плохо справляется с мультимодальным режимом, но это будет исправлено в будущем.
Технологии77 дней назад
Похожие новости







+18



+1



+1





Google представляет новые AI модели для роботов с улучшенными возможностями
Технологии
9 часов назад




Yandex Cloud обновила AI Studio для создания ИИ агентов без навыков разработки
Технологии
1 день назад




Google запускает доступный тариф AI Plus в 40 странах
Технологии
1 день назад




Рынок робоэдвайзинга растет благодаря genAI: 10% инвесторов используют ИИ для выбора акций
Технологии
12 часов назад




Meta анонсирует новую ИИ модель Code World Model для понимания кода
Технологии
14 часов назад


Skild AI представляет адаптивный ИИ для роботов, способный к самовосстановлению
Технологии
16 часов назад

