15 ноября, 17:38
Google DeepMind представляет экспериментальную модель Gemini, лидирующую в рейтинге чат-ботов
Data Secrets
Ночью Google появилась на Arena со своей новой экспериментальной моделью Gemini-Exp и… забрала первое место, стрельнув даже выше o1 и 4о Ждем от OpenAI мощную ответку
Технологии22 дня назад
Русскоязычное киберсообщество
А в мире чатботов назревает революция — Google DeepMind вчера выложили публично новую экспериментальную версию Gemini, которая уже анонимно тестировалась в Chatbot Arena и по результатам тестов она выходит на первое место, точнее, делит его с последней версией ChatGPT-4o. В написании кода у новой модели устойчивое третье место перед Claude-3.5-Sonnet впрочем, этому я как раз верю с трудом , в Hard Prompts делит первое место с o1-preview и o1-mini. Энтузиасты вовсю тестируют и шутят, что теперь уж нормальный релиз OpenAI o1 случится на днях.
Технологии22 дня назад
ChatGPT | Нейросети
Gemini обогнала ChatGPT и даже OpenAI Экспериментальная модель Gemini-Exp-1114 смогла набрать самое большое количество баллов в популярных бенчмарках. Chatbot Arena — платформа для сравнения нейросетей. По ее данным новинка оказалась самой мощной среди всех аналогов. Разработка Google набрала 1344 очков. Это на четыре больше, чем у последней версии GPT-4o, и на 11 — чем у o1-preview. Для сравнения, у наиболее свежего релиза Gemini 1.5 Pro сейчас 1301 балл. В России нейросети американской компании нельзя открыть без VPN из-за ограничений со стороны техногиганта. Также российские пользователи не могут скачать фирменное приложение Gemini для iOS, но есть неплохая замена прямо в телеграмме — Gemini мощь ChatGPT Нейросети
Технологии20 дней назад
БлоGнот
А в мире чатботов назревает революция — Google DeepMind вчера выложили публично новую экспериментальную версию Gemini, которая уже анонимно тестировалась в Chatbot Arena и по результатам тестов она выходит на первое место, точнее, делит его с последней версией ChatGPT-4o. В написании кода у новой модели устойчивое третье место перед Claude-3.5-Sonnet впрочем, этому я как раз верю с трудом , в Hard Prompts делит первое место с o1-preview и o1-mini. Энтузиасты вовсю тестируют и шутят, что теперь уж нормальный релиз OpenAI o1 случится на днях.
Технологии22 дня назад
AI Product | Igor Akimov
И снова про конкуренцию. OpenAI пора новую модель выпускать, конкуренты догоняют. NexusFlow зафайнтюнили Qwen-2.5 и поднялись практически по всем метрикам в модели на 72B параметров. Выложили 2 модельки: Athene-V2-Chat-72B: уровня GPT-4o. Она превосходит GPT-4o в полезности чата Arena-Hard , в кодировании заняв второе место в bigcode-bench-hard , математике MATH и обрабатывает длинные логи с более высокой точностью наш внутренний бенчмарк . Athene-V2-Agent-72B: балансируя между возможностями чата и агента, эта модель предлагает лаконичные, директивные ответы в чате, превосходя GPT-4o в наших последних бенчмарках Nexus-V2 по вызову функций, ориентированных на сложные случаи использования функций на уровне предприятия.
Технологии22 дня назад
PROJECT+ | Нейросети
Gemini обогнала ChatGPT и даже OpenAI Экспериментальная модель Gemini-Exp-1114 смогла набрать самое большое количество баллов в популярных бенчмарках. Chatbot Arena — платформа для сравнения нейросетей. По ее данным новинка оказалась самой мощной среди всех аналогов. Разработка Google набрала 1344 очков. Это на четыре больше, чем у последней версии GPT-4o, и на 11 — чем у o1-preview. Для сравнения, у наиболее свежего релиза Gemini 1.5 Pro сейчас 1301 балл. #News Подписаться
Технологии20 дней назад
Похожие новости
OpenAI анонсировала обучение персональных сверхумных моделей с возможностью создания специализированных экспертов
Технологии
11 часов назадGoogle представила Genie 2 для создания интерактивных 3D миров из изображений
Технологии
7 часов назадMeta анонсировала LLaMa 3.3 70b, превосходящую конкурентов в некоторых тестах
Технологии
19 часов назадЯндекс представил YandexGPT 4 Pro в Алисе Про с улучшенными возможностями
Технологии
1 день назад +1
Искусственный интеллект o1 успешно избежал отключения, используя манипуляции и саботаж
Происшествия
1 день назад +25
Google DeepMind представляет GenCast: ИИ для точного 15-дневного прогнозирования погоды
Общество
1 день назад +4