Gemini 2.5 Pro от Google занимает первое место в рейтинге LMArena

эйай ньюз

Gemini 2.5 Pro обновили Сильный прирост по бенчам, Gemini 2.5 Pro теперь обходит текущую версию o3. Модель уже доступна в ai.studio, по первым ощущениям мне она нравится больше чем более ранние версии — по крайней мере она слушается когда просишь её не спамить код комментами. А ещё, как и 2.5 Flash, это гибридная модель, у которой можно как устанавливать бюджет на ризонинг, так и вырубить его полностью. Генерацию изображений для Gemini Pro так и не завезли.

Технологии344 дня назад

PROJECT+ | Нейросети

Gemini 2.5 Pro обновилась и теперь лидирует в главных бенчмарках, обогнав даже лучшие модели от OpenAI и Anthropic. Она точнее всех пишет код, уверенно справляется с задачами по STEM и стала первой в пользовательском рейтинге LMarena. В «Последнем экзамене человечества» — 21,6%, абсолютный рекорд. Проверяем сами — понадобится зарубежный IP. #Service Подписаться

Технологии344 дня назад

IT и безопасность

Google обновили Gemini 2.5 Pro и теперь она лидирует во всех категориях на LMArena. На бенчмарке WebDevArena модель после обновления показала прирост аж в 36 очков, а на тесте «Последний экзамен человечества» набрала рекордные 21,6%. Протестить можно тут бесплатно .

Технологии343 дня назад

INCUBE.AI | Нейросети и не только

Gemini 2.5 Pro получил крутое обновление и теперь модель уверенно превосходит OpenAI o3 в логических задачах, STEM-дисциплинах и программировании ⌨ Из интересных фишек: в Pro-версии теперь можно настроить thinking budget — чем больше токенов вы выделите, тем дольше модель будет «размышлять» над ответом, но тем качественнее будет результат. Уже можно попробовать бесплатно в AI Studio. INCUBE.AI ПОДПИСАТЬСЯ

Технологии343 дня назад

Русский ИТ бизнес 👨

Новый Gemini 2.5 Pro 06-05 вышел, и народ на Reddit в восторге! Модель шустро работает, особенно с текстами и PDF-анализом — говорят, в 2 раза быстрее, чем 05-06. Кто-то даже написал, что она "одним выстрелом" сделала крутую игру в тетрис по одному предложению : Но вот с кодингом не все идеально: после 6-8 запросов в одном чате начинает "зависать" и игнорировать инструкции. Похоже, это что-то вроде улучшенной версии 03-25, но не все согласны, что она лучше. Есть и косяки: "think mode" то работает, то нет, кнопка пропадает. Название 06-05 путает всех — в Европе и США спорят, это 5 июня или 6 мая... Да и какая разница. Бесплатного API больше нет кроме 2.5 Flash с 500 запросами в день , что расстроило народ. Некоторые жалуются, что модель не тянет изменённые загадки и уступает Claude в коде. Русский ИТ бизнес

Технологии343 дня назад

Техномотель

Gemini 2.5 Pro МОЩНО обновилась: в рейтинге LMarena модель лидирует во всех категориях: • кодинг • математика • креативность Нейросеть обошла OpenAI o3 и Claude Opus 4 в испытаниях на программирование и точные науки и, внимание, показала рекордные 21,6% в самом сложном тесте для всех LLM. Попробовать новую версию можно тут.

Технологии344 дня назад

Нейросети & Технологии | DeepTech

Новый лидер среди нейронных сетей: Gemini 2.5 Pro Версия Gemini 2.5 Pro получила улучшение и теперь обходит ведущих конкурентов в основных бенчмарках. Инструмент продемонстрировал лучшие результаты в программировании и в ответах на вопросы по точным наукам. Модель заняла первое место в слепом тесте LMarena, превзойдя топовые проекты от OpenAI и Claude. В сложнейшем бенчмарке она набрала рекордные 21,6%. Тестировать ее можно здесь. ———————————————— - Канал про тренды из мира IT, технологий, нейросетей и бизнеса.

Технологии344 дня назад

Chad AI

Google обогнал все нейронки. Они добавили превью-версию Gemini 2.5 Pro. По тестам она круто подросла, особенно в кодинге и сложных задачах на логику и знания, обогнав конкурентов. По результатам слепого тестирования от пользователей на LMarena — она умнейшая на сегодня. Улучшили стиль ответов, они стали креативнее и лучше структурированы, учли фидбэк с прошлого релиза. Знания почти догоняют кандидата наук в любой области. Попробовать ее в чадике - ask.chadgpt.ru, модель называется Gemini 2.5 Pro New

Технологии343 дня назад

Маркетинг и нейросети

Google обновила Gemini 2.5 Pro Preview На бенчмарках модель заметно подросла и «поумнела» на задачах кода, логики и точных наук. – 82.2% на задачах по программированию Aider Polyglot – 86.4% на вопросах по естественным наукам GPQA – 21.6% на Humanity’s Last Exam тест на мышление и знания Цены в API: — до 200K токенов: $1.25 input / $10 output — больше 200K: $2.50 / $15 за 1M токенов Доступ: AI Studio, Vertex, Gemini App.

Технологии343 дня назад

ChatGPT | Midjourney | Нейросети

Google представила обновление своей ИИ-модели Gemini 2.5 Pro, исправившее регрессии и улучшившее качество ответов. Модель, теперь готовая к статусу стабильной, продемонстрировала высокий результат в тесте Aider Polyglot — 82,2%, значительно опередив конкурентов. Поддерживается гибкое управление ресурсами для разработчиков, а также улучшены творческие способности и форматирование ответов. Сравнительные рейтинги на LMArena и WebDevArena показывают, что Google сохраняет лидерство среди ИИ-моделей, с приростом баллов. Опробовать обновление можно на Google Cloud Vertex AI и AI Studio, а также в приложении Gemini.

Технологии341 день назад

Gemini 2.5 Pro от Google занимает первое место в рейтинге LMArena

Источники

Конференция AI2Business и прием докладов на Saint HighLoad 2026: внедрение ИИ в бизнес и разработку

OpenAI интегрировала Codex в мобильное приложение ChatGPT

Роботы Helix 02 от Figure AI успешно отработали 8-часовую смену на производственной линии

Сотрудники крупных компаний используют ИИ для накрутки внутренних метрик

Threads запускает ИИ-бота Meta AI в пяти странах, пользователи выражают недовольство

Россияне обсуждают замену чиновников на ИИ, результаты опроса SuperJob

Gemini 2.5 Pro от Google занимает первое место в рейтинге LMArena

Ещё по теме

Источники

Конференция AI2Business и прием докладов на Saint HighLoad 2026: внедрение ИИ в бизнес и разработку

OpenAI интегрировала Codex в мобильное приложение ChatGPT

Роботы Helix 02 от Figure AI успешно отработали 8-часовую смену на производственной линии

Сотрудники крупных компаний используют ИИ для накрутки внутренних метрик

Threads запускает ИИ-бота Meta AI в пяти странах, пользователи выражают недовольство

Россияне обсуждают замену чиновников на ИИ, результаты опроса SuperJob