10 июля, 09:03

Запуск нейросети Grok 4 от xAI: Прорыв в AGI и лидерство в тестах

Илон Маск выкатил монстра — вышла нейронка Grok 4, которая меняет правила.  Это не просто улучшение — это скачок в сторону настоящего AGI.  Что умеет:  — Предсказывает события — показала точный прогноз спортивного чемпионата, используя только данные и контекст. — Формулирует новые рабочие гипотезы по физике, пригодные для применения в инженерных проектах. — Прошла 44,4% «финального» AGI-теста, до которого большинство моделей даже не доходят. — Закрывает 100% задач по высшей математике — буквально нечего поставить в пример, чего она бы не решила.  Релиз уже сегодня. Ждем имбу — здесь.
Рестарт
Рестарт
Илон Маск выкатил монстра — вышла нейронка Grok 4, которая меняет правила. Это не просто улучшение — это скачок в сторону настоящего AGI. Что умеет: — Предсказывает события — показала точный прогноз спортивного чемпионата, используя только данные и контекст. — Формулирует новые рабочие гипотезы по физике, пригодные для применения в инженерных проектах. — Прошла 44,4% «финального» AGI-теста, до которого большинство моделей даже не доходят. — Закрывает 100% задач по высшей математике — буквально нечего поставить в пример, чего она бы не решила. Релиз уже сегодня. Ждем имбу — здесь.
Вышел Grok 4  SOTA на нескольких бенчах — выбивает идеальный результат на AIME25. Результаты на ARC-AGI-2 почти в два раза выше чем у прошлого лидера — Claude 4 Opus, 15.9% против 8,6%.   Но больше всего xAI гордятся Humanity s Last Exam, которому посвятили почти половину презентации. Результаты и правда хорошие — с максимальным компьютом и с доступом к инструментам модель выдаёт 44,4%  50.7% на текстовой части . Без тулюза всё ещё SOTA, но с меньшим отрывом — модель выбивает 25.4%, против 21.6% у Gemini 2.5 Pro.   Базовая модель та же самая что у Grok 3  Grok 4 изначально хотели запустить как Grok 3.5, но решили потренировать подольше . Основное отличие — на тренировку ризонингу потрачено в 10x больше компьюта. Теперь компьют на RL примерно равен компьюту на претрейн, с чем я вас и поздравляю  . Что важно — модель теперь нативно учат тулюзу во время RL, как и o3 с o4-mini.  С мультимодальностью всё не очень — бенчмарки показали почти исключительно текстовые, а на HLE видна заметная просадка. Илон это обещает поправить уже со следующей версией базовой модели. А вот контекст удвоили до 256k.  Запустили и API, цена за токен такая же как у Grok 3 и Claude Sonnet, но модель очень разговорчивая — на реальных задачах она стоит почти как Claude Opus 4. Grok 4 Mini не состоялся, а жаль — Grok 3 Mini крайне хорошая модель за свою цену, хотелось бы апдейта.  А тем временем компьют xAI расширяется с неслыханными темпами — Илон говорит что они собираются начать тренировку своей видеомодели на 100k+ GB200 через 3-4 недели. Уже есть деньги и на следующее расширение Colossus — в конце прошлого месяца компания привлекла 10 миллиардов долларов. Половину от инвесторов, а половину — в долг.
эйай ньюз
эйай ньюз
Вышел Grok 4 SOTA на нескольких бенчах — выбивает идеальный результат на AIME25. Результаты на ARC-AGI-2 почти в два раза выше чем у прошлого лидера — Claude 4 Opus, 15.9% против 8,6%. Но больше всего xAI гордятся Humanity s Last Exam, которому посвятили почти половину презентации. Результаты и правда хорошие — с максимальным компьютом и с доступом к инструментам модель выдаёт 44,4% 50.7% на текстовой части . Без тулюза всё ещё SOTA, но с меньшим отрывом — модель выбивает 25.4%, против 21.6% у Gemini 2.5 Pro. Базовая модель та же самая что у Grok 3 Grok 4 изначально хотели запустить как Grok 3.5, но решили потренировать подольше . Основное отличие — на тренировку ризонингу потрачено в 10x больше компьюта. Теперь компьют на RL примерно равен компьюту на претрейн, с чем я вас и поздравляю . Что важно — модель теперь нативно учат тулюзу во время RL, как и o3 с o4-mini. С мультимодальностью всё не очень — бенчмарки показали почти исключительно текстовые, а на HLE видна заметная просадка. Илон это обещает поправить уже со следующей версией базовой модели. А вот контекст удвоили до 256k. Запустили и API, цена за токен такая же как у Grok 3 и Claude Sonnet, но модель очень разговорчивая — на реальных задачах она стоит почти как Claude Opus 4. Grok 4 Mini не состоялся, а жаль — Grok 3 Mini крайне хорошая модель за свою цену, хотелось бы апдейта. А тем временем компьют xAI расширяется с неслыханными темпами — Илон говорит что они собираются начать тренировку своей видеомодели на 100k+ GB200 через 3-4 недели. Уже есть деньги и на следующее расширение Colossus — в конце прошлого месяца компания привлекла 10 миллиардов долларов. Половину от инвесторов, а половину — в долг.
БлоGнот
БлоGнот
xAI впервые вышла в лидеры рынка ИИ — Grok 4 набрал 73 балла в Intelligence Index, опередив o3 70 , Gemini 2.5 Pro 70 и Claude 4 Opus 64 . Это первый случай, когда модель не из "большой тройки" OpenAI, Google, Anthropic занимает первое место в комплексном рейтинге Artificial Analysis. Grok 4 показал рекордные 88% в GPQA Diamond и 94% в AIME 2024. Это reasoning-модель, которая "думает" перед ответом, хотя сами токены рассуждений через API не передаются. Цена $3/$15 за миллион входящих/исходящих токенов идентична Claude 4 Sonnet, но выше чем у Gemini 2.5 Pro $1.25/$10 и o3 $2/$8 . Скорость 75 токенов в секунду уступает o3 188 и Gemini 2.5 Pro 142 , но опережает Claude 4 Opus Thinking 66 . Контекстное окно 256K токенов — меньше чем у Gemini 2.5 Pro 1M , но больше чем у конкурентов 200K у Claude и o3, 128K у R1 . Поддерживает текст, изображения, вызовы функций и структурированные выходы. Правда, Маск прямо на презентации признал, что модель пока плохо справляется с мультимодальным режимом, но это будет исправлено в будущем.
Ежедневно обновляем ассортимент, чтобы вы могли покупать дешевле и лучше.
skidmarket.ru
skidmarket.ru
Ежедневно обновляем ассортимент, чтобы вы могли покупать дешевле и лучше.
Grok 4 от xAI вышел — теперь это №1 среди LLM  По первым тестам Grok 4 лидирует в главном индексе интеллекта Artificial Analysis  73% , обогнав OpenAI o3 и Gemini 2.5 Pro  оба по 70% . В математике и кодинге тоже уверенный отрыв. Попутно побил рекорды в GPQA и Humanity’s Last Exam.  Контекст модели — 256k токенов, есть поддержка изображений, структурированных ответов, вызова функций и других приятных штук    Цены выше, чем у Gemini 2.5 Pro и o3, но дешевле, чем o3-pro и Claude 4 Opus. API уже доступен  Сегодня выкатывают сразу две версии: стандартный Grok и Grok Heavy  за который придётся отваливать $300 в месяц
Bard AI | Нейросети & IT
Bard AI | Нейросети & IT
Grok 4 от xAI вышел — теперь это №1 среди LLM По первым тестам Grok 4 лидирует в главном индексе интеллекта Artificial Analysis 73% , обогнав OpenAI o3 и Gemini 2.5 Pro оба по 70% . В математике и кодинге тоже уверенный отрыв. Попутно побил рекорды в GPQA и Humanity’s Last Exam. Контекст модели — 256k токенов, есть поддержка изображений, структурированных ответов, вызова функций и других приятных штук Цены выше, чем у Gemini 2.5 Pro и o3, но дешевле, чем o3-pro и Claude 4 Opus. API уже доступен Сегодня выкатывают сразу две версии: стандартный Grok и Grok Heavy за который придётся отваливать $300 в месяц
Диджитальная
Диджитальная
Компания xAI Илона Маска официально запустила Grok 4 — новую версию ИИ с улучшенным мышлением, поддержкой кода и «anti-woke» подходом. Что он умеет: - Предсказывает события — показала точный прогноз спортивного чемпионата, используя только данные и контекст. - Формулирует новые рабочие гипотезы по физике, пригодные для применения в инженерных проектах. - Прошла 44.4% «финального» AGI-теста, до которого большинство моделей даже не доходят. - Закрывает 100% задач по высшей математике — буквально нечего поставить в пример, чего она бы не решила. Доступна бесплатно для подписчиков X Premium+.
Grok 4 от xAI — новый лидер в мире ИИ  Сегодня, 9 июля 2025 года, xAI представила Grok 4 — самую мощную модель ИИ на сегодня. Она обходит GPT-4o, Gemini 2.5 Pro и Claude 4 Opus в тестах по логике, математике и анализу данных.  Что умеет Grok 4?   Решает задачи уровня PhD и прогнозирует события  например, исход Мировой серии бейсбола .   Программирует как профи с Grok 4 Code — автодополнение и отладка в реальном времени.  Скоро: обработка изображений и генерация видео.  Доступен через X  для Premium+ , iOS/Android и API.  Цена: от $30/мес, премиум  SuperGrok Heavy  — $300/мес.   В ЕС и UK пока недоступен из-за регуляций.  Grok 4 обещает открыть новые технологии уже в 2025 году. Ждем.
BelVestnik
BelVestnik
Grok 4 от xAI — новый лидер в мире ИИ Сегодня, 9 июля 2025 года, xAI представила Grok 4 — самую мощную модель ИИ на сегодня. Она обходит GPT-4o, Gemini 2.5 Pro и Claude 4 Opus в тестах по логике, математике и анализу данных. Что умеет Grok 4? Решает задачи уровня PhD и прогнозирует события например, исход Мировой серии бейсбола . Программирует как профи с Grok 4 Code — автодополнение и отладка в реальном времени. Скоро: обработка изображений и генерация видео. Доступен через X для Premium+ , iOS/Android и API. Цена: от $30/мес, премиум SuperGrok Heavy — $300/мес. В ЕС и UK пока недоступен из-за регуляций. Grok 4 обещает открыть новые технологии уже в 2025 году. Ждем.