5 июня, 21:07
Gemini 2.5 Pro от Google занимает первое место в рейтинге LMArena


эйай ньюз
Gemini 2.5 Pro обновили Сильный прирост по бенчам, Gemini 2.5 Pro теперь обходит текущую версию o3. Модель уже доступна в ai.studio, по первым ощущениям мне она нравится больше чем более ранние версии — по крайней мере она слушается когда просишь её не спамить код комментами. А ещё, как и 2.5 Flash, это гибридная модель, у которой можно как устанавливать бюджет на ризонинг, так и вырубить его полностью. Генерацию изображений для Gemini Pro так и не завезли.
Технологии1 день назад


Техномотель
Gemini 2.5 Pro МОЩНО обновилась: в рейтинге LMarena модель лидирует во всех категориях: • кодинг • математика • креативность Нейросеть обошла OpenAI o3 и Claude Opus 4 в испытаниях на программирование и точные науки и, внимание, показала рекордные 21,6% в самом сложном тесте для всех LLM. Попробовать новую версию можно тут.
Технологии1 день назад


PROJECT+ | Нейросети
Gemini 2.5 Pro обновилась и теперь лидирует в главных бенчмарках, обогнав даже лучшие модели от OpenAI и Anthropic. Она точнее всех пишет код, уверенно справляется с задачами по STEM и стала первой в пользовательском рейтинге LMarena. В «Последнем экзамене человечества» — 21,6%, абсолютный рекорд. Проверяем сами — понадобится зарубежный IP. #Service Подписаться
Технологии1 день назад


IT и безопасность
Google обновили Gemini 2.5 Pro и теперь она лидирует во всех категориях на LMArena. На бенчмарке WebDevArena модель после обновления показала прирост аж в 36 очков, а на тесте «Последний экзамен человечества» набрала рекордные 21,6%. Протестить можно тут бесплатно .
Технологии22 часа назад


Маркетинг и нейросети
Google обновила Gemini 2.5 Pro Preview На бенчмарках модель заметно подросла и «поумнела» на задачах кода, логики и точных наук. – 82.2% на задачах по программированию Aider Polyglot – 86.4% на вопросах по естественным наукам GPQA – 21.6% на Humanity’s Last Exam тест на мышление и знания Цены в API: — до 200K токенов: $1.25 input / $10 output — больше 200K: $2.50 / $15 за 1M токенов Доступ: AI Studio, Vertex, Gemini App.
Технологии19 часов назад


Русский ИТ бизнес 👨
Новый Gemini 2.5 Pro 06-05 вышел, и народ на Reddit в восторге! Модель шустро работает, особенно с текстами и PDF-анализом — говорят, в 2 раза быстрее, чем 05-06. Кто-то даже написал, что она "одним выстрелом" сделала крутую игру в тетрис по одному предложению : Но вот с кодингом не все идеально: после 6-8 запросов в одном чате начинает "зависать" и игнорировать инструкции. Похоже, это что-то вроде улучшенной версии 03-25, но не все согласны, что она лучше. Есть и косяки: "think mode" то работает, то нет, кнопка пропадает. Название 06-05 путает всех — в Европе и США спорят, это 5 июня или 6 мая... Да и какая разница. Бесплатного API больше нет кроме 2.5 Flash с 500 запросами в день , что расстроило народ. Некоторые жалуются, что модель не тянет изменённые загадки и уступает Claude в коде. Русский ИТ бизнес
Технологии14 часов назад




Нейросети & Технологии | DeepTech
Новый лидер среди нейронных сетей: Gemini 2.5 Pro Версия Gemini 2.5 Pro получила улучшение и теперь обходит ведущих конкурентов в основных бенчмарках. Инструмент продемонстрировал лучшие результаты в программировании и в ответах на вопросы по точным наукам. Модель заняла первое место в слепом тесте LMarena, превзойдя топовые проекты от OpenAI и Claude. В сложнейшем бенчмарке она набрала рекордные 21,6%. Тестировать ее можно здесь. ———————————————— - Канал про тренды из мира IT, технологий, нейросетей и бизнеса.
Технологии1 день назад


Chad AI
Google обогнал все нейронки. Они добавили превью-версию Gemini 2.5 Pro. По тестам она круто подросла, особенно в кодинге и сложных задачах на логику и знания, обогнав конкурентов. По результатам слепого тестирования от пользователей на LMarena — она умнейшая на сегодня. Улучшили стиль ответов, они стали креативнее и лучше структурированы, учли фидбэк с прошлого релиза. Знания почти догоняют кандидата наук в любой области. Попробовать ее в чадике - ask.chadgpt.ru, модель называется Gemini 2.5 Pro New
Технологии1 день назад


INCUBE.AI | Нейросети и не только
Gemini 2.5 Pro получил крутое обновление и теперь модель уверенно превосходит OpenAI o3 в логических задачах, STEM-дисциплинах и программировании ⌨ Из интересных фишек: в Pro-версии теперь можно настроить thinking budget — чем больше токенов вы выделите, тем дольше модель будет «размышлять» над ответом, но тем качественнее будет результат. Уже можно попробовать бесплатно в AI Studio. INCUBE.AI ПОДПИСАТЬСЯ
Технологии20 часов назад


Unlim AI
Google представила обновление своей ИИ-модели Gemini 2.5 Pro, исправившее регрессии и улучшившее качество ответов. Модель, теперь готовая к статусу стабильной, продемонстрировала высокий результат в тесте Aider Polyglot — 82,2%, значительно опередив конкурентов. Поддерживается гибкое управление ресурсами для разработчиков, а также улучшены творческие способности и форматирование ответов. Сравнительные рейтинги на LMArena и WebDevArena показывают, что Google сохраняет лидерство среди ИИ-моделей, с приростом баллов. Опробовать обновление можно на Google Cloud Vertex AI и AI Studio, а также в приложении Gemini. Источник изображений: blog.google Подробнее: Google Blog
Технологии18 часов назад

Похожие новости



+7



+12







+3



+1



+2

GigaChat 2.0 представил новую функцию редактирования изображений без артефактов
Технологии
1 день назад




ElevenLabs представили новую версию TTS движка v3 с поддержкой аудиотегов и диалогов
Технологии
22 часа назад




ИИ-агент Manus запускает функцию генерации видеороликов из текстовых промптов
Технологии
9 часов назад




Константин Маркелов на конференции ЦИПР-2025: Бизнес и образование должны объединиться для подготовки специалистов в области ИИ
Общество
22 часа назад




Сбер представил GigaIDE Pro — российскую альтернативу зарубежным IDE на конференции ЦИПР
Технологии
20 часов назад


![Аватар Телеграм канала: [404] — программирование](https://content.tek.fm/558d7694-ddc7-45dc-ae5e-8c65b7ac388c.jpg)

МТС AdTech запускает ИИ-помощника для рекламных кампаний
Технологии
1 день назад


