5 июня, 21:07
Gemini 2.5 Pro от Google занимает первое место в рейтинге LMArena


эйай ньюз
Gemini 2.5 Pro обновили Сильный прирост по бенчам, Gemini 2.5 Pro теперь обходит текущую версию o3. Модель уже доступна в ai.studio, по первым ощущениям мне она нравится больше чем более ранние версии — по крайней мере она слушается когда просишь её не спамить код комментами. А ещё, как и 2.5 Flash, это гибридная модель, у которой можно как устанавливать бюджет на ризонинг, так и вырубить его полностью. Генерацию изображений для Gemini Pro так и не завезли.
Технологии75 дней назад


PROJECT+ | Нейросети
Gemini 2.5 Pro обновилась и теперь лидирует в главных бенчмарках, обогнав даже лучшие модели от OpenAI и Anthropic. Она точнее всех пишет код, уверенно справляется с задачами по STEM и стала первой в пользовательском рейтинге LMarena. В «Последнем экзамене человечества» — 21,6%, абсолютный рекорд. Проверяем сами — понадобится зарубежный IP. #Service Подписаться
Технологии75 дней назад


IT и безопасность
Google обновили Gemini 2.5 Pro и теперь она лидирует во всех категориях на LMArena. На бенчмарке WebDevArena модель после обновления показала прирост аж в 36 очков, а на тесте «Последний экзамен человечества» набрала рекордные 21,6%. Протестить можно тут бесплатно .
Технологии75 дней назад


INCUBE.AI | Нейросети и не только
Gemini 2.5 Pro получил крутое обновление и теперь модель уверенно превосходит OpenAI o3 в логических задачах, STEM-дисциплинах и программировании ⌨ Из интересных фишек: в Pro-версии теперь можно настроить thinking budget — чем больше токенов вы выделите, тем дольше модель будет «размышлять» над ответом, но тем качественнее будет результат. Уже можно попробовать бесплатно в AI Studio. INCUBE.AI ПОДПИСАТЬСЯ
Технологии75 дней назад


Unlim AI
Google представила обновление своей ИИ-модели Gemini 2.5 Pro, исправившее регрессии и улучшившее качество ответов. Модель, теперь готовая к статусу стабильной, продемонстрировала высокий результат в тесте Aider Polyglot — 82,2%, значительно опередив конкурентов. Поддерживается гибкое управление ресурсами для разработчиков, а также улучшены творческие способности и форматирование ответов. Сравнительные рейтинги на LMArena и WebDevArena показывают, что Google сохраняет лидерство среди ИИ-моделей, с приростом баллов. Опробовать обновление можно на Google Cloud Vertex AI и AI Studio, а также в приложении Gemini. Источник изображений: blog.google Подробнее: Google Blog
Технологии74 дня назад



Техномотель
Gemini 2.5 Pro МОЩНО обновилась: в рейтинге LMarena модель лидирует во всех категориях: • кодинг • математика • креативность Нейросеть обошла OpenAI o3 и Claude Opus 4 в испытаниях на программирование и точные науки и, внимание, показала рекордные 21,6% в самом сложном тесте для всех LLM. Попробовать новую версию можно тут.
Технологии75 дней назад


Нейросети & Технологии | DeepTech
Новый лидер среди нейронных сетей: Gemini 2.5 Pro Версия Gemini 2.5 Pro получила улучшение и теперь обходит ведущих конкурентов в основных бенчмарках. Инструмент продемонстрировал лучшие результаты в программировании и в ответах на вопросы по точным наукам. Модель заняла первое место в слепом тесте LMarena, превзойдя топовые проекты от OpenAI и Claude. В сложнейшем бенчмарке она набрала рекордные 21,6%. Тестировать ее можно здесь. ———————————————— - Канал про тренды из мира IT, технологий, нейросетей и бизнеса.
Технологии75 дней назад


Chad AI
Google обогнал все нейронки. Они добавили превью-версию Gemini 2.5 Pro. По тестам она круто подросла, особенно в кодинге и сложных задачах на логику и знания, обогнав конкурентов. По результатам слепого тестирования от пользователей на LMarena — она умнейшая на сегодня. Улучшили стиль ответов, они стали креативнее и лучше структурированы, учли фидбэк с прошлого релиза. Знания почти догоняют кандидата наук в любой области. Попробовать ее в чадике - ask.chadgpt.ru, модель называется Gemini 2.5 Pro New
Технологии75 дней назад


Маркетинг и нейросети
Google обновила Gemini 2.5 Pro Preview На бенчмарках модель заметно подросла и «поумнела» на задачах кода, логики и точных наук. – 82.2% на задачах по программированию Aider Polyglot – 86.4% на вопросах по естественным наукам GPQA – 21.6% на Humanity’s Last Exam тест на мышление и знания Цены в API: — до 200K токенов: $1.25 input / $10 output — больше 200K: $2.50 / $15 за 1M токенов Доступ: AI Studio, Vertex, Gemini App.
Технологии74 дня назад


Русский ИТ бизнес 👨
Новый Gemini 2.5 Pro 06-05 вышел, и народ на Reddit в восторге! Модель шустро работает, особенно с текстами и PDF-анализом — говорят, в 2 раза быстрее, чем 05-06. Кто-то даже написал, что она "одним выстрелом" сделала крутую игру в тетрис по одному предложению : Но вот с кодингом не все идеально: после 6-8 запросов в одном чате начинает "зависать" и игнорировать инструкции. Похоже, это что-то вроде улучшенной версии 03-25, но не все согласны, что она лучше. Есть и косяки: "think mode" то работает, то нет, кнопка пропадает. Название 06-05 путает всех — в Европе и США спорят, это 5 июня или 6 мая... Да и какая разница. Бесплатного API больше нет кроме 2.5 Flash с 500 запросами в день , что расстроило народ. Некоторые жалуются, что модель не тянет изменённые загадки и уступает Claude в коде. Русский ИТ бизнес
Технологии74 дня назад

Похожие новости



+3




+5




+6



+10

GPT-5 демонстрирует значительное улучшение в кибервзломах по сравнению с предыдущими моделями
Технологии
23 часа назад




ChatGPT демонстрирует высокую точность в прогнозировании и техническом анализе
Технологии
1 день назад![Аватар Телеграм канала: TechGPT [🅽 🅴 🆆 🆂] 🤖](https://content.tek.fm/bd4b9ecf-3d92-4de2-b607-537e17576d84.jpg)

Anthropic обновляет политику использования Claude AI для повышения безопасности
Технологии
1 день назад



Илон Маск анонсировал телефонные разговоры с нейросетью Grok за $30 в месяц
Технологии
1 день назад


Обсуждение безопасности и эффективности беспилотной авиации на форумах в России
Общество
19 часов назад




X5 Group запускает новое направление Х5 Robotics для внедрения роботизированных решений
Технологии
1 день назад


