10 июля, 09:03

Запуск нейросети Grok 4 от xAI: Прорыв в AGI и лидерство в тестах

Илон Маск выкатил монстра — вышла нейронка Grok 4, которая меняет правила.  Это не просто улучшение — это скачок в сторону настоящего AGI.  Что умеет:  — Предсказывает события — показала точный прогноз спортивного чемпионата, используя только данные и контекст. — Формулирует новые рабочие гипотезы по физике, пригодные для применения в инженерных проектах. — Прошла 44,4% «финального» AGI-теста, до которого большинство моделей даже не доходят. — Закрывает 100% задач по высшей математике — буквально нечего поставить в пример, чего она бы не решила.  Релиз уже сегодня. Ждем имбу — здесь.
Рестарт
Рестарт
Илон Маск выкатил монстра — вышла нейронка Grok 4, которая меняет правила. Это не просто улучшение — это скачок в сторону настоящего AGI. Что умеет: — Предсказывает события — показала точный прогноз спортивного чемпионата, используя только данные и контекст. — Формулирует новые рабочие гипотезы по физике, пригодные для применения в инженерных проектах. — Прошла 44,4% «финального» AGI-теста, до которого большинство моделей даже не доходят. — Закрывает 100% задач по высшей математике — буквально нечего поставить в пример, чего она бы не решила. Релиз уже сегодня. Ждем имбу — здесь.
Вышел Grok 4  SOTA на нескольких бенчах — выбивает идеальный результат на AIME25. Результаты на ARC-AGI-2 почти в два раза выше чем у прошлого лидера — Claude 4 Opus, 15.9% против 8,6%.   Но больше всего xAI гордятся Humanity s Last Exam, которому посвятили почти половину презентации. Результаты и правда хорошие — с максимальным компьютом и с доступом к инструментам модель выдаёт 44,4%  50.7% на текстовой части . Без тулюза всё ещё SOTA, но с меньшим отрывом — модель выбивает 25.4%, против 21.6% у Gemini 2.5 Pro.   Базовая модель та же самая что у Grok 3  Grok 4 изначально хотели запустить как Grok 3.5, но решили потренировать подольше . Основное отличие — на тренировку ризонингу потрачено в 10x больше компьюта. Теперь компьют на RL примерно равен компьюту на претрейн, с чем я вас и поздравляю  . Что важно — модель теперь нативно учат тулюзу во время RL, как и o3 с o4-mini.  С мультимодальностью всё не очень — бенчмарки показали почти исключительно текстовые, а на HLE видна заметная просадка. Илон это обещает поправить уже со следующей версией базовой модели. А вот контекст удвоили до 256k.  Запустили и API, цена за токен такая же как у Grok 3 и Claude Sonnet, но модель очень разговорчивая — на реальных задачах она стоит почти как Claude Opus 4. Grok 4 Mini не состоялся, а жаль — Grok 3 Mini крайне хорошая модель за свою цену, хотелось бы апдейта.  А тем временем компьют xAI расширяется с неслыханными темпами — Илон говорит что они собираются начать тренировку своей видеомодели на 100k+ GB200 через 3-4 недели. Уже есть деньги и на следующее расширение Colossus — в конце прошлого месяца компания привлекла 10 миллиардов долларов. Половину от инвесторов, а половину — в долг.
эйай ньюз
эйай ньюз
Вышел Grok 4 SOTA на нескольких бенчах — выбивает идеальный результат на AIME25. Результаты на ARC-AGI-2 почти в два раза выше чем у прошлого лидера — Claude 4 Opus, 15.9% против 8,6%. Но больше всего xAI гордятся Humanity s Last Exam, которому посвятили почти половину презентации. Результаты и правда хорошие — с максимальным компьютом и с доступом к инструментам модель выдаёт 44,4% 50.7% на текстовой части . Без тулюза всё ещё SOTA, но с меньшим отрывом — модель выбивает 25.4%, против 21.6% у Gemini 2.5 Pro. Базовая модель та же самая что у Grok 3 Grok 4 изначально хотели запустить как Grok 3.5, но решили потренировать подольше . Основное отличие — на тренировку ризонингу потрачено в 10x больше компьюта. Теперь компьют на RL примерно равен компьюту на претрейн, с чем я вас и поздравляю . Что важно — модель теперь нативно учат тулюзу во время RL, как и o3 с o4-mini. С мультимодальностью всё не очень — бенчмарки показали почти исключительно текстовые, а на HLE видна заметная просадка. Илон это обещает поправить уже со следующей версией базовой модели. А вот контекст удвоили до 256k. Запустили и API, цена за токен такая же как у Grok 3 и Claude Sonnet, но модель очень разговорчивая — на реальных задачах она стоит почти как Claude Opus 4. Grok 4 Mini не состоялся, а жаль — Grok 3 Mini крайне хорошая модель за свою цену, хотелось бы апдейта. А тем временем компьют xAI расширяется с неслыханными темпами — Илон говорит что они собираются начать тренировку своей видеомодели на 100k+ GB200 через 3-4 недели. Уже есть деньги и на следующее расширение Colossus — в конце прошлого месяца компания привлекла 10 миллиардов долларов. Половину от инвесторов, а половину — в долг.
Закажите всё для дома и кухни онлайн и получайте выгоду с каждой покупки.
skidmarket.ru
skidmarket.ru
Закажите всё для дома и кухни онлайн и получайте выгоду с каждой покупки.
Grok 4 от xAI вышел — теперь это №1 среди LLM  По первым тестам Grok 4 лидирует в главном индексе интеллекта Artificial Analysis  73% , обогнав OpenAI o3 и Gemini 2.5 Pro  оба по 70% . В математике и кодинге тоже уверенный отрыв. Попутно побил рекорды в GPQA и Humanity’s Last Exam.  Контекст модели — 256k токенов, есть поддержка изображений, структурированных ответов, вызова функций и других приятных штук    Цены выше, чем у Gemini 2.5 Pro и o3, но дешевле, чем o3-pro и Claude 4 Opus. API уже доступен  Сегодня выкатывают сразу две версии: стандартный Grok и Grok Heavy  за который придётся отваливать $300 в месяц
Bard AI | Нейросети & IT
Bard AI | Нейросети & IT
Grok 4 от xAI вышел — теперь это №1 среди LLM По первым тестам Grok 4 лидирует в главном индексе интеллекта Artificial Analysis 73% , обогнав OpenAI o3 и Gemini 2.5 Pro оба по 70% . В математике и кодинге тоже уверенный отрыв. Попутно побил рекорды в GPQA и Humanity’s Last Exam. Контекст модели — 256k токенов, есть поддержка изображений, структурированных ответов, вызова функций и других приятных штук Цены выше, чем у Gemini 2.5 Pro и o3, но дешевле, чем o3-pro и Claude 4 Opus. API уже доступен Сегодня выкатывают сразу две версии: стандартный Grok и Grok Heavy за который придётся отваливать $300 в месяц
Диджитальная
Диджитальная
Компания xAI Илона Маска официально запустила Grok 4 — новую версию ИИ с улучшенным мышлением, поддержкой кода и «anti-woke» подходом. Что он умеет: - Предсказывает события — показала точный прогноз спортивного чемпионата, используя только данные и контекст. - Формулирует новые рабочие гипотезы по физике, пригодные для применения в инженерных проектах. - Прошла 44.4% «финального» AGI-теста, до которого большинство моделей даже не доходят. - Закрывает 100% задач по высшей математике — буквально нечего поставить в пример, чего она бы не решила. Доступна бесплатно для подписчиков X Premium+.