10 июля, 09:03
Запуск нейросети Grok 4 от xAI: Прорыв в AGI и лидерство в тестах


Рестарт
Илон Маск выкатил монстра — вышла нейронка Grok 4, которая меняет правила. Это не просто улучшение — это скачок в сторону настоящего AGI. Что умеет: — Предсказывает события — показала точный прогноз спортивного чемпионата, используя только данные и контекст. — Формулирует новые рабочие гипотезы по физике, пригодные для применения в инженерных проектах. — Прошла 44,4% «финального» AGI-теста, до которого большинство моделей даже не доходят. — Закрывает 100% задач по высшей математике — буквально нечего поставить в пример, чего она бы не решила. Релиз уже сегодня. Ждем имбу — здесь.
Технологии17 часов назад


эйай ньюз
Вышел Grok 4 SOTA на нескольких бенчах — выбивает идеальный результат на AIME25. Результаты на ARC-AGI-2 почти в два раза выше чем у прошлого лидера — Claude 4 Opus, 15.9% против 8,6%. Но больше всего xAI гордятся Humanity s Last Exam, которому посвятили почти половину презентации. Результаты и правда хорошие — с максимальным компьютом и с доступом к инструментам модель выдаёт 44,4% 50.7% на текстовой части . Без тулюза всё ещё SOTA, но с меньшим отрывом — модель выбивает 25.4%, против 21.6% у Gemini 2.5 Pro. Базовая модель та же самая что у Grok 3 Grok 4 изначально хотели запустить как Grok 3.5, но решили потренировать подольше . Основное отличие — на тренировку ризонингу потрачено в 10x больше компьюта. Теперь компьют на RL примерно равен компьюту на претрейн, с чем я вас и поздравляю . Что важно — модель теперь нативно учат тулюзу во время RL, как и o3 с o4-mini. С мультимодальностью всё не очень — бенчмарки показали почти исключительно текстовые, а на HLE видна заметная просадка. Илон это обещает поправить уже со следующей версией базовой модели. А вот контекст удвоили до 256k. Запустили и API, цена за токен такая же как у Grok 3 и Claude Sonnet, но модель очень разговорчивая — на реальных задачах она стоит почти как Claude Opus 4. Grok 4 Mini не состоялся, а жаль — Grok 3 Mini крайне хорошая модель за свою цену, хотелось бы апдейта. А тем временем компьют xAI расширяется с неслыханными темпами — Илон говорит что они собираются начать тренировку своей видеомодели на 100k+ GB200 через 3-4 недели. Уже есть деньги и на следующее расширение Colossus — в конце прошлого месяца компания привлекла 10 миллиардов долларов. Половину от инвесторов, а половину — в долг.
Технологии15 часов назад

БлоGнот
xAI впервые вышла в лидеры рынка ИИ — Grok 4 набрал 73 балла в Intelligence Index, опередив o3 70 , Gemini 2.5 Pro 70 и Claude 4 Opus 64 . Это первый случай, когда модель не из "большой тройки" OpenAI, Google, Anthropic занимает первое место в комплексном рейтинге Artificial Analysis. Grok 4 показал рекордные 88% в GPQA Diamond и 94% в AIME 2024. Это reasoning-модель, которая "думает" перед ответом, хотя сами токены рассуждений через API не передаются. Цена $3/$15 за миллион входящих/исходящих токенов идентична Claude 4 Sonnet, но выше чем у Gemini 2.5 Pro $1.25/$10 и o3 $2/$8 . Скорость 75 токенов в секунду уступает o3 188 и Gemini 2.5 Pro 142 , но опережает Claude 4 Opus Thinking 66 . Контекстное окно 256K токенов — меньше чем у Gemini 2.5 Pro 1M , но больше чем у конкурентов 200K у Claude и o3, 128K у R1 . Поддерживает текст, изображения, вызовы функций и структурированные выходы. Правда, Маск прямо на презентации признал, что модель пока плохо справляется с мультимодальным режимом, но это будет исправлено в будущем.
Технологии2 часа назад

skidmarket.ru
Ежедневно обновляем ассортимент, чтобы вы могли покупать дешевле и лучше.
Реклама2 часа назад


Bard AI | Нейросети & IT
Grok 4 от xAI вышел — теперь это №1 среди LLM По первым тестам Grok 4 лидирует в главном индексе интеллекта Artificial Analysis 73% , обогнав OpenAI o3 и Gemini 2.5 Pro оба по 70% . В математике и кодинге тоже уверенный отрыв. Попутно побил рекорды в GPQA и Humanity’s Last Exam. Контекст модели — 256k токенов, есть поддержка изображений, структурированных ответов, вызова функций и других приятных штук Цены выше, чем у Gemini 2.5 Pro и o3, но дешевле, чем o3-pro и Claude 4 Opus. API уже доступен Сегодня выкатывают сразу две версии: стандартный Grok и Grok Heavy за который придётся отваливать $300 в месяц
Технологии16 часов назад

Диджитальная
Компания xAI Илона Маска официально запустила Grok 4 — новую версию ИИ с улучшенным мышлением, поддержкой кода и «anti-woke» подходом. Что он умеет: - Предсказывает события — показала точный прогноз спортивного чемпионата, используя только данные и контекст. - Формулирует новые рабочие гипотезы по физике, пригодные для применения в инженерных проектах. - Прошла 44.4% «финального» AGI-теста, до которого большинство моделей даже не доходят. - Закрывает 100% задач по высшей математике — буквально нечего поставить в пример, чего она бы не решила. Доступна бесплатно для подписчиков X Premium+.
Технологии15 часов назад


BelVestnik
Grok 4 от xAI — новый лидер в мире ИИ Сегодня, 9 июля 2025 года, xAI представила Grok 4 — самую мощную модель ИИ на сегодня. Она обходит GPT-4o, Gemini 2.5 Pro и Claude 4 Opus в тестах по логике, математике и анализу данных. Что умеет Grok 4? Решает задачи уровня PhD и прогнозирует события например, исход Мировой серии бейсбола . Программирует как профи с Grok 4 Code — автодополнение и отладка в реальном времени. Скоро: обработка изображений и генерация видео. Доступен через X для Premium+ , iOS/Android и API. Цена: от $30/мес, премиум SuperGrok Heavy — $300/мес. В ЕС и UK пока недоступен из-за регуляций. Grok 4 обещает открыть новые технологии уже в 2025 году. Ждем.
Технологии3 часа назад
Похожие новости



+41



+3



+7



+28



+3



+5

Илон Маск анонсирует Grok 4 с уникальными возможностями и подпиской
Технологии
15 часов назад




Обновления AI-бота Grok от xAI: новые функции и вызовы
Технологии
1 день назад




Чат-бот Grok от xAI подвержен критике за антисемитские высказывания
Технологии
1 день назад




Нейросеть Илонa Маска Grok обновилась и вызвала споры
Общество
1 день назад




OpenAI анонсировала запуск универсальной модели GPT-5 в 2025 году
Технологии
1 день назад




Представлена модель Centaur, имитирующая человеческое поведение
Технологии
55 минут назад


