Акция
15 ноября, 17:38

Google DeepMind представляет экспериментальную модель Gemini, лидирующую в рейтинге чат-ботов

Ночью Google появилась на Arena со своей новой экспериментальной моделью Gemini-Exp и… забрала первое место, стрельнув даже выше o1 и 4о   Ждем от OpenAI мощную ответку
Data Secrets
Data Secrets
Ночью Google появилась на Arena со своей новой экспериментальной моделью Gemini-Exp и… забрала первое место, стрельнув даже выше o1 и 4о Ждем от OpenAI мощную ответку
И снова про конкуренцию. OpenAI пора новую модель выпускать, конкуренты догоняют.  NexusFlow зафайнтюнили Qwen-2.5 и поднялись практически по всем метрикам в модели на 72B параметров. Выложили 2 модельки:  Athene-V2-Chat-72B: уровня GPT-4o. Она превосходит GPT-4o в полезности чата  Arena-Hard , в кодировании  заняв второе место в bigcode-bench-hard , математике  MATH  и обрабатывает длинные логи с более высокой точностью  наш внутренний бенчмарк .  Athene-V2-Agent-72B: балансируя между возможностями чата и агента, эта модель предлагает лаконичные, директивные ответы в чате, превосходя GPT-4o в наших последних бенчмарках Nexus-V2 по вызову функций, ориентированных на сложные случаи использования функций на уровне предприятия.
AI Product | Igor Akimov
AI Product | Igor Akimov
И снова про конкуренцию. OpenAI пора новую модель выпускать, конкуренты догоняют. NexusFlow зафайнтюнили Qwen-2.5 и поднялись практически по всем метрикам в модели на 72B параметров. Выложили 2 модельки: Athene-V2-Chat-72B: уровня GPT-4o. Она превосходит GPT-4o в полезности чата Arena-Hard , в кодировании заняв второе место в bigcode-bench-hard , математике MATH и обрабатывает длинные логи с более высокой точностью наш внутренний бенчмарк . Athene-V2-Agent-72B: балансируя между возможностями чата и агента, эта модель предлагает лаконичные, директивные ответы в чате, превосходя GPT-4o в наших последних бенчмарках Nexus-V2 по вызову функций, ориентированных на сложные случаи использования функций на уровне предприятия.
Забирай эксклюзивное предложение для пользователей Tek.fm от Газпромбанка
        
        🔥Нажми на меня
Tek.fm
Tek.fm
Забирай эксклюзивное предложение для пользователей Tek.fm от Газпромбанка 🔥Нажми на меня
БлоGнот
БлоGнот
А в мире чатботов назревает революция — Google DeepMind вчера выложили публично новую экспериментальную версию Gemini, которая уже анонимно тестировалась в Chatbot Arena и по результатам тестов она выходит на первое место, точнее, делит его с последней версией ChatGPT-4o. В написании кода у новой модели устойчивое третье место перед Claude-3.5-Sonnet впрочем, этому я как раз верю с трудом , в Hard Prompts делит первое место с o1-preview и o1-mini. Энтузиасты вовсю тестируют и шутят, что теперь уж нормальный релиз OpenAI o1 случится на днях.