15 ноября, 17:38

Google DeepMind представляет экспериментальную модель Gemini, лидирующую в рейтинге чат-ботов

Ночью Google появилась на Arena со своей новой экспериментальной моделью Gemini-Exp и… забрала первое место, стрельнув даже выше o1 и 4о   Ждем от OpenAI мощную ответку
Data Secrets
Data Secrets
Ночью Google появилась на Arena со своей новой экспериментальной моделью Gemini-Exp и… забрала первое место, стрельнув даже выше o1 и 4о Ждем от OpenAI мощную ответку
Русскоязычное киберсообщество
Русскоязычное киберсообщество
А в мире чатботов назревает революция — Google DeepMind вчера выложили публично новую экспериментальную версию Gemini, которая уже анонимно тестировалась в Chatbot Arena и по результатам тестов она выходит на первое место, точнее, делит его с последней версией ChatGPT-4o. В написании кода у новой модели устойчивое третье место перед Claude-3.5-Sonnet впрочем, этому я как раз верю с трудом , в Hard Prompts делит первое место с o1-preview и o1-mini. Энтузиасты вовсю тестируют и шутят, что теперь уж нормальный релиз OpenAI o1 случится на днях.
Gemini обогнала ChatGPT и даже OpenAI  Экспериментальная модель Gemini-Exp-1114 смогла набрать самое большое количество баллов в популярных бенчмарках.  Chatbot Arena — платформа для сравнения нейросетей. По ее данным новинка оказалась самой мощной среди всех аналогов.   Разработка Google набрала 1344 очков. Это на четыре больше, чем у последней версии GPT-4o, и на 11 — чем у o1-preview.  Для сравнения, у наиболее свежего релиза Gemini 1.5 Pro сейчас 1301 балл.  В России нейросети американской компании нельзя открыть без VPN из-за ограничений со стороны техногиганта.   Также российские пользователи не могут скачать фирменное приложение Gemini для iOS, но есть неплохая замена прямо в телеграмме    — Gemini мощь  ChatGPT   Нейросети
ChatGPT | Нейросети
ChatGPT | Нейросети
Gemini обогнала ChatGPT и даже OpenAI Экспериментальная модель Gemini-Exp-1114 смогла набрать самое большое количество баллов в популярных бенчмарках. Chatbot Arena — платформа для сравнения нейросетей. По ее данным новинка оказалась самой мощной среди всех аналогов. Разработка Google набрала 1344 очков. Это на четыре больше, чем у последней версии GPT-4o, и на 11 — чем у o1-preview. Для сравнения, у наиболее свежего релиза Gemini 1.5 Pro сейчас 1301 балл. В России нейросети американской компании нельзя открыть без VPN из-за ограничений со стороны техногиганта. Также российские пользователи не могут скачать фирменное приложение Gemini для iOS, но есть неплохая замена прямо в телеграмме — Gemini мощь ChatGPT Нейросети
Успей оформить подарок для тех, кто в теме. Жми и узнавай
₿tc-card.com
₿tc-card.com
Успей оформить подарок для тех, кто в теме. Жми и узнавай
БлоGнот
БлоGнот
А в мире чатботов назревает революция — Google DeepMind вчера выложили публично новую экспериментальную версию Gemini, которая уже анонимно тестировалась в Chatbot Arena и по результатам тестов она выходит на первое место, точнее, делит его с последней версией ChatGPT-4o. В написании кода у новой модели устойчивое третье место перед Claude-3.5-Sonnet впрочем, этому я как раз верю с трудом , в Hard Prompts делит первое место с o1-preview и o1-mini. Энтузиасты вовсю тестируют и шутят, что теперь уж нормальный релиз OpenAI o1 случится на днях.
И снова про конкуренцию. OpenAI пора новую модель выпускать, конкуренты догоняют.  NexusFlow зафайнтюнили Qwen-2.5 и поднялись практически по всем метрикам в модели на 72B параметров. Выложили 2 модельки:  Athene-V2-Chat-72B: уровня GPT-4o. Она превосходит GPT-4o в полезности чата  Arena-Hard , в кодировании  заняв второе место в bigcode-bench-hard , математике  MATH  и обрабатывает длинные логи с более высокой точностью  наш внутренний бенчмарк .  Athene-V2-Agent-72B: балансируя между возможностями чата и агента, эта модель предлагает лаконичные, директивные ответы в чате, превосходя GPT-4o в наших последних бенчмарках Nexus-V2 по вызову функций, ориентированных на сложные случаи использования функций на уровне предприятия.
AI Product | Igor Akimov
AI Product | Igor Akimov
И снова про конкуренцию. OpenAI пора новую модель выпускать, конкуренты догоняют. NexusFlow зафайнтюнили Qwen-2.5 и поднялись практически по всем метрикам в модели на 72B параметров. Выложили 2 модельки: Athene-V2-Chat-72B: уровня GPT-4o. Она превосходит GPT-4o в полезности чата Arena-Hard , в кодировании заняв второе место в bigcode-bench-hard , математике MATH и обрабатывает длинные логи с более высокой точностью наш внутренний бенчмарк . Athene-V2-Agent-72B: балансируя между возможностями чата и агента, эта модель предлагает лаконичные, директивные ответы в чате, превосходя GPT-4o в наших последних бенчмарках Nexus-V2 по вызову функций, ориентированных на сложные случаи использования функций на уровне предприятия.
Gemini обогнала ChatGPT и даже OpenAI  Экспериментальная модель Gemini-Exp-1114 смогла набрать самое большое количество баллов в популярных бенчмарках.  Chatbot Arena — платформа для сравнения нейросетей. По ее данным новинка оказалась самой мощной среди всех аналогов.   Разработка Google набрала 1344 очков. Это на четыре больше, чем у последней версии GPT-4o, и на 11 — чем у o1-preview.  Для сравнения, у наиболее свежего релиза Gemini 1.5 Pro сейчас 1301 балл.  #News   Подписаться
PROJECT+ | Нейросети
PROJECT+ | Нейросети
Gemini обогнала ChatGPT и даже OpenAI Экспериментальная модель Gemini-Exp-1114 смогла набрать самое большое количество баллов в популярных бенчмарках. Chatbot Arena — платформа для сравнения нейросетей. По ее данным новинка оказалась самой мощной среди всех аналогов. Разработка Google набрала 1344 очков. Это на четыре больше, чем у последней версии GPT-4o, и на 11 — чем у o1-preview. Для сравнения, у наиболее свежего релиза Gemini 1.5 Pro сейчас 1301 балл. #News Подписаться
Loading indicator gif