5 июня, 21:07

Gemini 2.5 Pro от Google занимает первое место в рейтинге LMArena

Gemini 2.5 Pro обновили  Сильный прирост по бенчам, Gemini 2.5 Pro теперь обходит текущую версию o3. Модель уже доступна в ai.studio, по первым ощущениям мне она нравится больше чем более ранние версии — по крайней мере она слушается когда просишь её не спамить код комментами. А ещё, как и 2.5 Flash, это гибридная модель, у которой можно как устанавливать бюджет на ризонинг, так и вырубить его полностью. Генерацию изображений для Gemini Pro так и не завезли.
эйай ньюз
эйай ньюз
Gemini 2.5 Pro обновили Сильный прирост по бенчам, Gemini 2.5 Pro теперь обходит текущую версию o3. Модель уже доступна в ai.studio, по первым ощущениям мне она нравится больше чем более ранние версии — по крайней мере она слушается когда просишь её не спамить код комментами. А ещё, как и 2.5 Flash, это гибридная модель, у которой можно как устанавливать бюджет на ризонинг, так и вырубить его полностью. Генерацию изображений для Gemini Pro так и не завезли.
Gemini 2.5 Pro МОЩНО обновилась: в рейтинге LMarena модель лидирует во всех категориях:   • кодинг • математика  • креативность   Нейросеть обошла OpenAI o3 и Claude Opus 4 в испытаниях на программирование и точные науки и, внимание, показала рекордные 21,6% в самом сложном тесте для всех LLM.   Попробовать новую версию можно тут.
Техномотель
Техномотель
Gemini 2.5 Pro МОЩНО обновилась: в рейтинге LMarena модель лидирует во всех категориях: • кодинг • математика • креативность Нейросеть обошла OpenAI o3 и Claude Opus 4 в испытаниях на программирование и точные науки и, внимание, показала рекордные 21,6% в самом сложном тесте для всех LLM. Попробовать новую версию можно тут.
Gemini 2.5 Pro обновилась и теперь лидирует в главных бенчмарках, обогнав даже лучшие модели от OpenAI и Anthropic.  Она точнее всех пишет код, уверенно справляется с задачами по STEM и стала первой в пользовательском рейтинге LMarena. В «Последнем экзамене человечества» — 21,6%, абсолютный рекорд.  Проверяем сами — понадобится зарубежный IP.  #Service   Подписаться
PROJECT+ | Нейросети
PROJECT+ | Нейросети
Gemini 2.5 Pro обновилась и теперь лидирует в главных бенчмарках, обогнав даже лучшие модели от OpenAI и Anthropic. Она точнее всех пишет код, уверенно справляется с задачами по STEM и стала первой в пользовательском рейтинге LMarena. В «Последнем экзамене человечества» — 21,6%, абсолютный рекорд. Проверяем сами — понадобится зарубежный IP. #Service Подписаться
Google обновили Gemini 2.5 Pro и теперь она лидирует во всех категориях на LMArena.  На бенчмарке WebDevArena модель после обновления показала прирост аж в 36 очков, а на тесте «Последний экзамен человечества» набрала рекордные 21,6%.  Протестить можно тут  бесплатно .
IT и безопасность
IT и безопасность
Google обновили Gemini 2.5 Pro и теперь она лидирует во всех категориях на LMArena. На бенчмарке WebDevArena модель после обновления показала прирост аж в 36 очков, а на тесте «Последний экзамен человечества» набрала рекордные 21,6%. Протестить можно тут бесплатно .
Google обновила Gemini 2.5 Pro  Preview   На бенчмарках модель заметно подросла и «поумнела» на задачах кода, логики и точных наук.  – 82.2% на задачах по программированию  Aider Polyglot  – 86.4% на вопросах по естественным наукам  GPQA  – 21.6% на Humanity’s Last Exam  тест на мышление и знания   Цены в API: — до 200K токенов: $1.25 input / $10 output — больше 200K: $2.50 / $15  за 1M токенов   Доступ: AI Studio, Vertex, Gemini App.
Маркетинг и нейросети
Маркетинг и нейросети
Google обновила Gemini 2.5 Pro Preview На бенчмарках модель заметно подросла и «поумнела» на задачах кода, логики и точных наук. – 82.2% на задачах по программированию Aider Polyglot – 86.4% на вопросах по естественным наукам GPQA – 21.6% на Humanity’s Last Exam тест на мышление и знания Цены в API: — до 200K токенов: $1.25 input / $10 output — больше 200K: $2.50 / $15 за 1M токенов Доступ: AI Studio, Vertex, Gemini App.
Новый Gemini 2.5 Pro  06-05  вышел, и народ на Reddit в восторге! Модель шустро работает, особенно с текстами и PDF-анализом — говорят, в 2 раза быстрее, чем 05-06. Кто-то даже написал, что она "одним выстрелом" сделала крутую игру в тетрис по одному предложению :   Но вот с кодингом не все идеально: после 6-8 запросов в одном чате начинает "зависать" и игнорировать инструкции. Похоже, это что-то вроде улучшенной версии 03-25, но не все согласны, что она лучше.  Есть и косяки: "think mode" то работает, то нет, кнопка пропадает. Название 06-05 путает всех — в Европе и США спорят, это 5 июня или 6 мая... Да и какая разница.  Бесплатного API больше нет  кроме 2.5 Flash с 500 запросами в день , что расстроило народ. Некоторые жалуются, что модель не тянет изменённые загадки и уступает Claude в коде.  Русский ИТ бизнес
Русский ИТ бизнес 👨
Русский ИТ бизнес 👨
Новый Gemini 2.5 Pro 06-05 вышел, и народ на Reddit в восторге! Модель шустро работает, особенно с текстами и PDF-анализом — говорят, в 2 раза быстрее, чем 05-06. Кто-то даже написал, что она "одним выстрелом" сделала крутую игру в тетрис по одному предложению : Но вот с кодингом не все идеально: после 6-8 запросов в одном чате начинает "зависать" и игнорировать инструкции. Похоже, это что-то вроде улучшенной версии 03-25, но не все согласны, что она лучше. Есть и косяки: "think mode" то работает, то нет, кнопка пропадает. Название 06-05 путает всех — в Европе и США спорят, это 5 июня или 6 мая... Да и какая разница. Бесплатного API больше нет кроме 2.5 Flash с 500 запросами в день , что расстроило народ. Некоторые жалуются, что модель не тянет изменённые загадки и уступает Claude в коде. Русский ИТ бизнес
Loading indicator gif
Умный помощник, который всегда под рукой
1chatgpt.ru
1chatgpt.ru
Умный помощник, который всегда под рукой
Новый лидер среди нейронных сетей: Gemini 2.5 Pro  Версия Gemini 2.5 Pro получила улучшение и теперь обходит ведущих конкурентов в основных бенчмарках. Инструмент продемонстрировал лучшие результаты в программировании и в ответах на вопросы по точным наукам.  Модель заняла первое место в слепом тесте LMarena, превзойдя топовые проекты от OpenAI и Claude. В сложнейшем бенчмарке она набрала рекордные 21,6%. Тестировать ее можно здесь.  ————————————————   - Канал про тренды из мира IT, технологий, нейросетей и бизнеса.
Нейросети & Технологии | DeepTech
Нейросети & Технологии | DeepTech
Новый лидер среди нейронных сетей: Gemini 2.5 Pro Версия Gemini 2.5 Pro получила улучшение и теперь обходит ведущих конкурентов в основных бенчмарках. Инструмент продемонстрировал лучшие результаты в программировании и в ответах на вопросы по точным наукам. Модель заняла первое место в слепом тесте LMarena, превзойдя топовые проекты от OpenAI и Claude. В сложнейшем бенчмарке она набрала рекордные 21,6%. Тестировать ее можно здесь. ———————————————— - Канал про тренды из мира IT, технологий, нейросетей и бизнеса.
Google обогнал все нейронки. Они добавили превью-версию Gemini 2.5 Pro. По тестам она круто подросла, особенно в кодинге и сложных задачах на логику и знания, обогнав конкурентов.  По результатам слепого тестирования от пользователей на LMarena — она умнейшая на сегодня.   Улучшили стиль ответов, они стали креативнее и лучше структурированы, учли фидбэк с прошлого релиза. Знания почти догоняют кандидата наук в любой области.  Попробовать ее в чадике - ask.chadgpt.ru, модель называется Gemini 2.5 Pro  New
Chad AI
Chad AI
Google обогнал все нейронки. Они добавили превью-версию Gemini 2.5 Pro. По тестам она круто подросла, особенно в кодинге и сложных задачах на логику и знания, обогнав конкурентов. По результатам слепого тестирования от пользователей на LMarena — она умнейшая на сегодня. Улучшили стиль ответов, они стали креативнее и лучше структурированы, учли фидбэк с прошлого релиза. Знания почти догоняют кандидата наук в любой области. Попробовать ее в чадике - ask.chadgpt.ru, модель называется Gemini 2.5 Pro New
Gemini 2.5 Pro получил крутое обновление и теперь модель уверенно превосходит OpenAI o3 в логических задачах, STEM-дисциплинах и программировании ⌨   Из интересных фишек: в Pro-версии теперь можно настроить thinking budget — чем больше токенов вы выделите, тем дольше модель будет «размышлять» над ответом, но тем качественнее будет результат.  Уже можно попробовать бесплатно в AI Studio.  INCUBE.AI   ПОДПИСАТЬСЯ
INCUBE.AI | Нейросети и не только
INCUBE.AI | Нейросети и не только
Gemini 2.5 Pro получил крутое обновление и теперь модель уверенно превосходит OpenAI o3 в логических задачах, STEM-дисциплинах и программировании ⌨ Из интересных фишек: в Pro-версии теперь можно настроить thinking budget — чем больше токенов вы выделите, тем дольше модель будет «размышлять» над ответом, но тем качественнее будет результат. Уже можно попробовать бесплатно в AI Studio. INCUBE.AI ПОДПИСАТЬСЯ
Google представила обновление своей ИИ-модели Gemini 2.5 Pro, исправившее регрессии и улучшившее качество ответов. Модель, теперь готовая к статусу стабильной, продемонстрировала высокий результат в тесте Aider Polyglot — 82,2%, значительно опередив конкурентов. Поддерживается гибкое управление ресурсами для разработчиков, а также улучшены творческие способности и форматирование ответов.  Сравнительные рейтинги на LMArena и WebDevArena показывают, что Google сохраняет лидерство среди ИИ-моделей, с приростом баллов. Опробовать обновление можно на Google Cloud Vertex AI и AI Studio, а также в приложении Gemini.  Источник изображений: blog.google   Подробнее: Google Blog
Unlim AI
Unlim AI
Google представила обновление своей ИИ-модели Gemini 2.5 Pro, исправившее регрессии и улучшившее качество ответов. Модель, теперь готовая к статусу стабильной, продемонстрировала высокий результат в тесте Aider Polyglot — 82,2%, значительно опередив конкурентов. Поддерживается гибкое управление ресурсами для разработчиков, а также улучшены творческие способности и форматирование ответов. Сравнительные рейтинги на LMArena и WebDevArena показывают, что Google сохраняет лидерство среди ИИ-моделей, с приростом баллов. Опробовать обновление можно на Google Cloud Vertex AI и AI Studio, а также в приложении Gemini. Источник изображений: blog.google Подробнее: Google Blog
Loading indicator gif