6 августа, 04:39
Google запускает Game Arena для оценки ИИ через настольные игры

Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Google только что представили новую платформу для оценки ИИ Современные ИИ-бенчмарки с трудом успевают за современными моделями. Хотя они полезны для измерения производительности модели в конкретных задачах, трудно понять, действительно ли модели, обученные на интернет-данных, решают проблемы или просто запоминают ответы. Kaggle Game Arena - платформа с открытым исходным кодом, где модели соревнуются в сложных играх, чтобы помочь оценить их возможности. Game Arena построена на платформе Kaggle для справедливой, стандартизированной среды оценки моделей. Google говорит, что игры могут служить отличной площадкой для измерения широкого спектра способностей, которые мы часто интерпретируем как интеллект. Напомним, что Google и Anthropic часто заставляют свои последние модели играть в игры. Об этом мы писали и объясняли тут. Завтра 5 августа состоится специальная шахматная выставка, где 8 передовых моделей сразятся в турнире на выбывание. Мероприятие будет проводиться лучшими шахматными экспертами мира.
Технологии6 дней назад


Шахматы +
На платформе Kaggle Game Arena пройдёт турнир по шахматам среди нейросетей Главная цель соревнования — узнать, какая модель искусственного интеллекта лучше играет в шахматы без предварительной подготовки. По итогам турнира Kaggle посчитает рейтинг Эло каждой нейросети Соревнование состоится в партнёрстве с Chess. com и Take Take Take. Начало первого игрового дня — сегодня в 20:00 по московскому времени Ph.: Kaggle
Технологии6 дней назад


Machinelearning
Google и Kaggle запустили открытую Game Arena — платформу, где ИИ-системы соревнуются в стратегических играх, чтобы измерить интеллект. Зачем это нужно? Старые бенчмарки уже не работают — LLM просто запоминают ответы. Идея в том, что игры — лучший бенчмарк для проверки интеллекта. Они проверяют не факты, а стратегическое мышление, адаптацию и память. Первый турнир: шахматы пройдет сегодня. 8 передовых моделей, включая GPT‑4, Claude Opus и Gemini, сразятся друг с другом без использования внешних инструментов. По итогам матчей формируется открытый рейтинг моделей — кто реально умеет думать, а не просто угадывать. Главное отличие от других арен: Круговая система «каждый играет с каждым». Позиции меняются каждую секунду Ошибки наказываются немедленно Побеждает не та, что знает ответ, а та, что думает Kaggle собирает рейтинг моделей, который будет обновляться по итогам матчей. В будущем добавят Го, покер и видеоигры. Стримы первых соревнований пройдут: 5–7 августа на YouTube с Хикару, Леви и Магнусом Карлсеном. Подробнее об Арене: #google #kaggle #arena
Технологии6 дней назад

ForkLog FEED
Корпорация Google запустила платформу Game Arena, на которой ИИ-модели и агенты могут соревноваться друг с другом в стратегических играх вроде шахмат. «Игры идеально подходят для оценки искусственного интеллекта, потому что они помогают нам понять, как модели справляются со сложными задачами рассуждения. Многие игры являются аналогом реальных навыков и позволяют проверить способности нейросети в таких областях, как стратегическое планирование, адаптация и память», — говорится в анонсе. В честь открытия Game Arena компания проведет турнир по шахматам с участием ИИ. Он пройдет в период с 5 по 7 августа и будет транслироваться онлайн. ChatGPT, Gemini, Claude, Grok, Deepseek и Kimi примут участие в мероприятии. Новости AI YouTube
Технологии6 дней назад

Левитов о шахматах
На платформе Kaggle Game Arena проходит выставочный чемпионат нейросетей по шахматам Компания Google при поддержке дочерней компании DeepMind организовала на платформе Kaggle Game Arena первый чемпионат среди нейросетей. Пока искусственный интеллект соревнуется только в шахматах, но в перспективе планируются чемпионаты и по другим дисциплинам. В чемпионате принимают участие восемь нейросетей, и далеко не все из них освоили базовые шахматные правила – многие из них играли на уровне начинающих и неоднократно допускали грубые зевки, а также пытались делать невозможные ходы. В итоге в полуфинал вышли две нейросети на базе OpenAI, Gemini 2.5 Pro при этом Gemini 2.5 Flash не показала должного уровня , а также Grok 4. Нейросеть Grok 4 разработана компанией xAI Илона Маска, который известен своим пренебрежительным отношением к шахматам, однако Grok уверенно выиграл четвертьфинальный матч. Маск уже прокомментировал это событие в своем стиле: «Если что, это побочный эффект. xAI практически не уделяла времени шахматам» #новости
Технологии5 дней назад


Чёрный Треугольник
Google DeepMind представила Game Arena — бенчмарк для тестирования LLM в настольных играх Game Arena предлагает самые разные игры для ИИ, от таких как шахматы, «Го» до «Мафии». Платформа развернута на Kaggle и дает пользователям возможность выбирать агентов LLM, например, Gemini 2.5 Pro и Claude Opus 4, для участия в матчах с использованием только системы распознавания изображений, без применения игровых движков. В рамках турниров осуществляется тщательная валидация ходов, и если модель нарушает правила трижды, она автоматически проигрывает. На данный момент турниры проводятся по круговой системе, но в будущем планируются новые форматы. В честь запуска Game Arena с 5 по 7 августа пройдет публичный турнир. ================ News Soft Gear Links
Технологии6 дней назад


Crestbook Шахматы
Хикару Накамура прокомментирует шахматный турнир с участием искусственного интеллекта. Компания Google вместе с платформой Kaggle запускает новую инициативу — Kaggle Game Arena, открытую площадку, где модели искусственного интеллекта будут сражаться друг с другом в интеллектуальных играх. Первая дисциплина — шахматы. Kaggle Game Arena проведёт трёхдневный выставочный шахматный турнир с использованием ИИ с 5 по 7 августа с участием восьми ведущих мировых моделей ИИ: Kimi k2 Moonshot AI ; Gemini 2.5 Pro Google ; Gemini 2.5 Flash Google ; o3 OpenAI ; o4-mini OpenAI ; Claude 4 Opus Anthropic ; Grok 4 xAI ; DeepSeek R1. Турнир завершится комментариями Магнуса Карлсена: он подведёт итоги и поделится своими мыслями об игре искусственных интеллектов.
Технологии6 дней назад


xCode Journal
Google DeepMind запустила Game Arena Исследователи Google DeepMind запустили Game Arena — бенчмарк с настольными играми для тестирования LLM. Команда разработчиков считает, что если у создателей LLM будет стандартизированный бенчмарк, то языковые модели быстрее научатся играть в шахматы и другие игры. Работу модуля OpenAI для борьбы с «галлюцинациями» описали в деталях Издание The Information, ранне рассказавшее о том, что в GPT-5 применили модуль Universal Verifier для борьбы с "галлюцинациями", опубликовало отдельную статью с подробностями этой системы. Фактически речь идет об отдельной специализированной нейросети, которая используется во время обучения с подкреплением, проверяя каждый ответ модели и выставляя им баллы. Вышел кроссплатформенный инструмент с открытым исходным кодом для создания скриншотов Flameshot 13.0 В начале августа 2025 года состоялся выпуск кроссплатформенного инструмента с открытым исходным кодом для создания скриншотов Flameshot 13.0. Исходный код проекта написан на C++ и опубликован на GitHub под лицензией GNU General Public License v3.0. Предыдущая стабильная версия Flameshot 12.1.0 вышла в июле 2022 года. Выпуск Flameshot 0.1.0 произошёл в июне 2017 года. xCode Journal
Технологии6 дней назад


Техничка
Google запускает турнир ИИ по шахматам Google создал платформу для соревнований нейросетей в стратегических играх, и прямо сейчас проходит трансляция шахматного турнира. Восемь ИИ-моделей, включая o4-mini, Grok 4 и Claude Opus 4, сражаются за звание лучшей. Стримы идут каждый вечер, а финал запланирован на 7 августа. Смотреть можно по ссылке. Это не просто шоу — такие турниры показывают, как ИИ справляется с принятием решений в сложных условиях. Техничка
Технологии5 дней назад

Блохи в свитере
На соревнованиях ИИ по шахматам на платформе Kaggle модель Grok 4 одержала победу над флагманским ИИ от Google — Gemini, обеспечив себе выход в гранд-финал.
Технологии4 дня назад

Похожие новости



+4



+2



+13



+2



+10



+7

Турниры по шашкам и шахматам в Приморье и Домодедове: активные жители демонстрируют спортивный дух
Спорт
17 часов назад




Юношеская сборная России по шахматам готовится к Олимпиаде в Колумбии
Спорт
1 день назад




Поддержка семей участников СВО: новые меры в Камчатском крае и сертификаты на материнский капитал в Республике Алтай
Происшествия
1 день назад




В Екатеринбурге создается столовая для работников ДЭУ по инициативе главы района
Общество
1 день назад




Казахстан усиливает контроль над искусственным интеллектом и кибербезопасностью
Общество
2 часа назад




Уязвимость ChatGPT: конфиденциальные данные под угрозой из-за вредоносных промптов
Технологии
1 день назад


