Gemini 2.5 Pro от Google занимает первое место в рейтинге LMArena

Gemini 2.5 Pro обновили Сильный прирост по бенчам, Gemini 2.5 Pro теперь обходит текущую версию o3. Модель уже доступна в ai.studio, по первым ощущениям мне она нравится больше чем более ранние версии — по крайней мере она слушается когда просишь её не спамить код комментами. А ещё, как и 2.5 Flash, это гибридная модель, у которой можно как устанавливать бюджет на ризонинг, так и вырубить его полностью. Генерацию изображений для Gemini Pro так и не завезли.

Технологии339 дней назад

Gemini 2.5 Pro обновилась и теперь лидирует в главных бенчмарках, обогнав даже лучшие модели от OpenAI и Anthropic. Она точнее всех пишет код, уверенно справляется с задачами по STEM и стала первой в пользовательском рейтинге LMarena. В «Последнем экзамене человечества» — 21,6%, абсолютный рекорд. Проверяем сами — понадобится зарубежный IP. #Service Подписаться

PROJECT+ | Нейросети

Gemini 2.5 Pro обновилась и теперь лидирует в главных бенчмарках, обогнав даже лучшие модели от OpenAI и Anthropic. Она точнее всех пишет код, уверенно справляется с задачами по STEM и стала первой в пользовательском рейтинге LMarena. В «Последнем экзамене человечества» — 21,6%, абсолютный рекорд. Проверяем сами — понадобится зарубежный IP. #Service Подписаться

Технологии339 дней назад

Google обновили Gemini 2.5 Pro и теперь она лидирует во всех категориях на LMArena. На бенчмарке WebDevArena модель после обновления показала прирост аж в 36 очков, а на тесте «Последний экзамен человечества» набрала рекордные 21,6%. Протестить можно тут бесплатно .

IT и безопасность

Google обновили Gemini 2.5 Pro и теперь она лидирует во всех категориях на LMArena. На бенчмарке WebDevArena модель после обновления показала прирост аж в 36 очков, а на тесте «Последний экзамен человечества» набрала рекордные 21,6%. Протестить можно тут бесплатно .

Технологии338 дней назад

Gemini 2.5 Pro получил крутое обновление и теперь модель уверенно превосходит OpenAI o3 в логических задачах, STEM-дисциплинах и программировании ⌨ Из интересных фишек: в Pro-версии теперь можно настроить thinking budget — чем больше токенов вы выделите, тем дольше модель будет «размышлять» над ответом, но тем качественнее будет результат. Уже можно попробовать бесплатно в AI Studio. INCUBE.AI ПОДПИСАТЬСЯ

INCUBE.AI | Нейросети и не только

Gemini 2.5 Pro получил крутое обновление и теперь модель уверенно превосходит OpenAI o3 в логических задачах, STEM-дисциплинах и программировании ⌨ Из интересных фишек: в Pro-версии теперь можно настроить thinking budget — чем больше токенов вы выделите, тем дольше модель будет «размышлять» над ответом, но тем качественнее будет результат. Уже можно попробовать бесплатно в AI Studio. INCUBE.AI ПОДПИСАТЬСЯ

Технологии338 дней назад

Новый Gemini 2.5 Pro 06-05 вышел, и народ на Reddit в восторге! Модель шустро работает, особенно с текстами и PDF-анализом — говорят, в 2 раза быстрее, чем 05-06. Кто-то даже написал, что она "одним выстрелом" сделала крутую игру в тетрис по одному предложению : Но вот с кодингом не все идеально: после 6-8 запросов в одном чате начинает "зависать" и игнорировать инструкции. Похоже, это что-то вроде улучшенной версии 03-25, но не все согласны, что она лучше. Есть и косяки: "think mode" то работает, то нет, кнопка пропадает. Название 06-05 путает всех — в Европе и США спорят, это 5 июня или 6 мая... Да и какая разница. Бесплатного API больше нет кроме 2.5 Flash с 500 запросами в день , что расстроило народ. Некоторые жалуются, что модель не тянет изменённые загадки и уступает Claude в коде. Русский ИТ бизнес

Русский ИТ бизнес 👨

Новый Gemini 2.5 Pro 06-05 вышел, и народ на Reddit в восторге! Модель шустро работает, особенно с текстами и PDF-анализом — говорят, в 2 раза быстрее, чем 05-06. Кто-то даже написал, что она "одним выстрелом" сделала крутую игру в тетрис по одному предложению : Но вот с кодингом не все идеально: после 6-8 запросов в одном чате начинает "зависать" и игнорировать инструкции. Похоже, это что-то вроде улучшенной версии 03-25, но не все согласны, что она лучше. Есть и косяки: "think mode" то работает, то нет, кнопка пропадает. Название 06-05 путает всех — в Европе и США спорят, это 5 июня или 6 мая... Да и какая разница. Бесплатного API больше нет кроме 2.5 Flash с 500 запросами в день , что расстроило народ. Некоторые жалуются, что модель не тянет изменённые загадки и уступает Claude в коде. Русский ИТ бизнес

Технологии338 дней назад

Gemini 2.5 Pro МОЩНО обновилась: в рейтинге LMarena модель лидирует во всех категориях: • кодинг • математика • креативность Нейросеть обошла OpenAI o3 и Claude Opus 4 в испытаниях на программирование и точные науки и, внимание, показала рекордные 21,6% в самом сложном тесте для всех LLM. Попробовать новую версию можно тут.

Техномотель

Gemini 2.5 Pro МОЩНО обновилась: в рейтинге LMarena модель лидирует во всех категориях: • кодинг • математика • креативность Нейросеть обошла OpenAI o3 и Claude Opus 4 в испытаниях на программирование и точные науки и, внимание, показала рекордные 21,6% в самом сложном тесте для всех LLM. Попробовать новую версию можно тут.

Технологии339 дней назад

Новый лидер среди нейронных сетей: Gemini 2.5 Pro Версия Gemini 2.5 Pro получила улучшение и теперь обходит ведущих конкурентов в основных бенчмарках. Инструмент продемонстрировал лучшие результаты в программировании и в ответах на вопросы по точным наукам. Модель заняла первое место в слепом тесте LMarena, превзойдя топовые проекты от OpenAI и Claude. В сложнейшем бенчмарке она набрала рекордные 21,6%. Тестировать ее можно здесь. ———————————————— - Канал про тренды из мира IT, технологий, нейросетей и бизнеса.

Нейросети & Технологии | DeepTech

Новый лидер среди нейронных сетей: Gemini 2.5 Pro Версия Gemini 2.5 Pro получила улучшение и теперь обходит ведущих конкурентов в основных бенчмарках. Инструмент продемонстрировал лучшие результаты в программировании и в ответах на вопросы по точным наукам. Модель заняла первое место в слепом тесте LMarena, превзойдя топовые проекты от OpenAI и Claude. В сложнейшем бенчмарке она набрала рекордные 21,6%. Тестировать ее можно здесь. ———————————————— - Канал про тренды из мира IT, технологий, нейросетей и бизнеса.

Технологии339 дней назад

Google обогнал все нейронки. Они добавили превью-версию Gemini 2.5 Pro. По тестам она круто подросла, особенно в кодинге и сложных задачах на логику и знания, обогнав конкурентов. По результатам слепого тестирования от пользователей на LMarena — она умнейшая на сегодня. Улучшили стиль ответов, они стали креативнее и лучше структурированы, учли фидбэк с прошлого релиза. Знания почти догоняют кандидата наук в любой области. Попробовать ее в чадике - ask.chadgpt.ru, модель называется Gemini 2.5 Pro New

Chad AI

Google обогнал все нейронки. Они добавили превью-версию Gemini 2.5 Pro. По тестам она круто подросла, особенно в кодинге и сложных задачах на логику и знания, обогнав конкурентов. По результатам слепого тестирования от пользователей на LMarena — она умнейшая на сегодня. Улучшили стиль ответов, они стали креативнее и лучше структурированы, учли фидбэк с прошлого релиза. Знания почти догоняют кандидата наук в любой области. Попробовать ее в чадике - ask.chadgpt.ru, модель называется Gemini 2.5 Pro New

Технологии338 дней назад

Google обновила Gemini 2.5 Pro Preview На бенчмарках модель заметно подросла и «поумнела» на задачах кода, логики и точных наук. – 82.2% на задачах по программированию Aider Polyglot – 86.4% на вопросах по естественным наукам GPQA – 21.6% на Humanity’s Last Exam тест на мышление и знания Цены в API: — до 200K токенов: $1.25 input / $10 output — больше 200K: $2.50 / $15 за 1M токенов Доступ: AI Studio, Vertex, Gemini App.

Маркетинг и нейросети

Google обновила Gemini 2.5 Pro Preview На бенчмарках модель заметно подросла и «поумнела» на задачах кода, логики и точных наук. – 82.2% на задачах по программированию Aider Polyglot – 86.4% на вопросах по естественным наукам GPQA – 21.6% на Humanity’s Last Exam тест на мышление и знания Цены в API: — до 200K токенов: $1.25 input / $10 output — больше 200K: $2.50 / $15 за 1M токенов Доступ: AI Studio, Vertex, Gemini App.

Технологии338 дней назад

Google представила обновление своей ИИ-модели Gemini 2.5 Pro, исправившее регрессии и улучшившее качество ответов. Модель, теперь готовая к статусу стабильной, продемонстрировала высокий результат в тесте Aider Polyglot — 82,2%, значительно опередив конкурентов. Поддерживается гибкое управление ресурсами для разработчиков, а также улучшены творческие способности и форматирование ответов. Сравнительные рейтинги на LMArena и WebDevArena показывают, что Google сохраняет лидерство среди ИИ-моделей, с приростом баллов. Опробовать обновление можно на Google Cloud Vertex AI и AI Studio, а также в приложении Gemini.

ChatGPT | Midjourney | Нейросети

Google представила обновление своей ИИ-модели Gemini 2.5 Pro, исправившее регрессии и улучшившее качество ответов. Модель, теперь готовая к статусу стабильной, продемонстрировала высокий результат в тесте Aider Polyglot — 82,2%, значительно опередив конкурентов. Поддерживается гибкое управление ресурсами для разработчиков, а также улучшены творческие способности и форматирование ответов. Сравнительные рейтинги на LMArena и WebDevArena показывают, что Google сохраняет лидерство среди ИИ-моделей, с приростом баллов. Опробовать обновление можно на Google Cloud Vertex AI и AI Studio, а также в приложении Gemini.

Технологии336 дней назад

Gemini 2.5 Pro от Google занимает первое место в рейтинге LMArena

Источники

Павел Дуров анонсировал успех TON в стейкинге среди криптовалют

Мощная солнечная вспышка ожидает геомагнитные бури на Земле

Инвестиции в ИИ приводят к снижению свободного денежного потока у американских IT гигантов

Александра Пахмутова делится кадрами инсталляции Свет Великой Победы в Волгограде

Qualcomm анонсировала новые процессоры Snapdragon 6 Gen 5 и 4 Gen 5 для улучшения производительности недорогих смартфонов

В Италии зафиксирован первый случай лечения зависимости от искусственного интеллекта