29 марта, 11:09

Claude 3 Opus обошел GPT-4 и стал лидером ChatBot Arena

Подготовлено редакцией Tek.fmДайджест Telegram-каналов

Claude 3 Opus сбросил GPT-4 с первого места в рейтинге языковых моделей Chatbot Arena. Его составляют энтузиасты на основе возможностей различных LLM. GPT-4 занимала первое место с мая прошлого года, когда топ только запустился. Скорее всего, Claude 3 Opus продержится на первом месте до выхода GPT-5. По слухам, он запланирован на июль-август.

Технологии777 дней назад

GeekNeural: IT & Нейросети

ChatGPT официально не лучший чат-бот в мире. За последнюю неделю у нейронки замечен аномальный уровень лени: он отказывается выполнять простейшие задачи, в особо запущенных случаях просит юзера сделать всё самому. В итоге GPT-4 впервые с истории сместили с первого места в рейтинге ChatBot Arena — теперь Claude 3 правит балом. Предательство не одобряем, но самого мощного бота можно потискать тут. Нужен VPN. GeekNeural #Useful

Технологии776 дней назад

Machinelearning

Claude 3 Opus сбросила GPT-4 с первого места в рейтинге языковых моделей ⏩Большая языковая модель LLM Claude 3 Opus от Anthropic впервые превзошла GPT-4 модель в основе ChatGPT от OpenAI на Chatbot Arena — популярной площадке, где пользователи оценивают качество работы чат-ботов. «Король мёртв», — написал в социальной сети X разработчик ПО Ник Добос. ⏩Зашедшим на сайт пользователям Chatbot Arena предлагается ввести запрос, после чего демонстрируются два результата от неуказанных языковых моделей — человек должен выбрать, какой результат нравится больше. Проведя тысячи сравнений, Chatbot Arena заполняет обновляемую рейтинговую таблицу. Сайт управляется исследовательской организацией Large Model Systems Organization LMSYS ORG , занимающейся открытыми ИИ-моделями. ⏩ «Впервые на вершине рейтинга ИИ-модели не от OpenAI: Opus для сложных задач, Haiku — для вариантов, когда нужно дёшево и быстро. Это обнадёживает — от конкуренции разработчиков все только выиграют. Тем не менее, GPT-4 уже больше года, и конкуренты догнали её только сейчас», — прокомментировал событие независимый исследователь ИИ Саймон Уиллисон Simon Willison .

Технологии776 дней назад

Нейроскептик

Продолжаем следить за первой десяткой рейтинга оценки лидеров больших языковых моделей LLM от LMSYS - huggingface. Что нового: Ну что же, Claude 3 Opus от Anthropic таки заняла первое место сместив модели от OpenAI, которые долгое время более одного года точно удерживали лидирующие позиции. И это неудивительно, ведь Anthropic утверждает, что Claude 3 Opus превзошла GPT-4 при сравнении на ключевых бенчмарках. Третья версия Claude способна работать не только с текстом, но и с изображениями. Главным отличием от GPT-4 стало большое окно контекста, позволяющее работать с книгами, научными статьями и другими объёмными документами. Все версии Claude 3 могут принимать текст длиной 200 тысяч токенов, и контекстное окно можно расширить до 1 млн токенов по индивидуальному запросу. Для сравнения: у GPT-4 Turbo размер контекста составляет 128 тысяч токенов. Также в десятку LLM на 7 место вошла Claude 3 Haiku и к Arena Elo Rating добавилось рекордное количество голосов, более 300 тысяч.

Технологии775 дней назад

Эксплойт

ChatGPT — не лучшая нейросеть, теперь официально. Последнюю неделю пользователи жалуются на аномальную лень ИИ: он отказывается выполнять поставленные задачи, а в особо запущенных случаях рассказывает пользователю, как выполнить её самостоятельно. Всё это привело к тому, что GPT-4 впервые с истории сместили с первого места на ChatBot Arena — теперь в лидерах Claude 3. OpenAI пора уже что-то делать.

Технологии776 дней назад

Нейросфера: нейросети, технологии

Технологии776 дней назад

BES.media

ChatGPT-4 больше не лидер в рейтинге чат-ботов Языковая модель Claude 3 Opus впервые превзошла лидера рейтингов искусственного интеллекта GPT-4. Что произошло На популярной площадке, где пользователи оценивают качество работы чат-ботов Chatbot Arena , впервые сместили с лидирующей позиции модель от OpenAI. Первое место заняла большая языковая модель Claude 3 Opus от Anthropiс. Детали "Впервые на вершине рейтинга ИИ-модели не от OpenAI. Это обнадёживает: от конкуренции разработчиков все только выиграют. Тем не менее, GPT-4 уже больше года, и конкуренты догнали её только сейчас", – написал независимый исследователь ИИ Саймон Уиллисон. ___ Посол США в Казахстане Дэниел Розенблюм дал интервью главному редактору BES.media Серикжану Маулетбаю. Смотрите на YouTube: ___

Технологии775 дней назад

Джарвис Ньюс | Нейросети

Технологии775 дней назад

вот это Бизнес

Сэм Альтман нажил главного врага ChatGPT Разработчики из стартапа Anthropic, которые выпускают на рынок ИИ-продукты, анонсировали новую нейросеть Claude 3. По некоторым результатам, она уже превосходит GPT-4 от OpenAI. Claude 3 заняла 1-е место в таблице The Chatbot Arena, где пользователи свободно выставляют оценки ИИ-инструментам. Всё дело в высоких результатах обработки естественного языка и безопасности, на которую основатели стартапа сделали упор – теперь это главное отличие от конкурентов. #вотэто_Стартапы

Технологии773 дня назад