18 октября, 15:57
NVIDIA анонсировала новые модели Llama 3.1, превзошедшие GPT-4o и Claude 3.5
NewSpace Times
NVIDIA молча выпустила файнтюн модели Llama 3.1 70B, которая превзошла по производительности GPT-4o и AnthropicAI Claude Sonnet 3.5. 85.0 на Arena Hard, 57.6 на AlpacaEval 2 LC, и 8.98 MT-Bench Превосходит GPT-4o и Claude 3.5 Sonnet на Нескольких бенчмарках Основан на Llama-3.1-70B-Instruct и обучен с помощью RLHF REINFORCE Выпущена также Llama-3.1-Nemotron-70B-Reward #2 на RewardBench Доступно на Hugging Face
Технологии33 дня назад
addmeto
Nvidia выпускают опенсорсную LLM Nemotron ну точнее это llama-3.1-nemotron-70B-Instruct, т.е. большая llama доученная на в нвидии . Утверждается что эта 70B модель лучше чем gpt-4o и Sonnet 3.5. Я еще не проверял, но если тесты подтвердятся, то сейчас начнется... В камементах правильно указывают, что даже на арене показатели этой модели на уровне LLama 3.1 и уж точно не догоняет gpt-4o
Технологии31 день назад
JavaRush – здесь становятся программистами
ИИ-модель Nvidia превзошла в тестах топовые модели OpenAI и Anthropic Модель Llama-3.1-Nemotron-70B-Instruct от Nvidia появилась на популярной ИИ-платформе Hugging Face без лишнего шума, но быстро привлекла внимание своими результатами в бенчмарках, которые оказались выше показателей GPT-4o OpenAI и Claude 3.5 Sonnet Anthropic . Подход Nvidia к созданию Llama-3.1-Nemotron-70B-Instruct заключался в улучшении модели Llama 3.1 с открытым исходным кодом от Meta с применением передовых методов обучения, включая обучение с подкреплением на основе обратной связи от человека RLHF . Этот метод позволяет ИИ учиться на предпочтениях пользователей, что может привести к более естественным и контекстуально уместным ответам. Способность модели обрабатывать сложные запросы без дополнительных подсказок или специализированных токенов выгодно отличает ее от других. Для компаний это означает меньшее количество ошибок, более полезные ответы и, в конечном итоге, лучшую удовлетворенность клиентов.
Технологии27 дней назад
NN
Nvidia опубликовали новую модель Llama-3.1-Nemotron-70B-Instruct-HF. Модель занимает первое место по некоторым бенчмаркам AlpacaEval, MT-Bench, Mean Response Length . В основе — опенсорсная Llama 3.1 от Meta , 70 млрд параметров и обучение методом RLHF с подкреплением человеческих отзывов . Тестируем тут. Meta признана в РФ экстремистской и запрещена
Технологии32 дня назад
Сфера Блогинга
Внезапно начали очень хвалить новую LLM-модель выложенную Nvidia — модель Nemotron 70B-Instruct представляет собой файн-тюнинг Llama 3.1, но по появляющимся заявлениям, превосходит в задачах кодинга и GPT-4o, и Claude 3.5 Sonnet. Правда, в официальной Chatbot Arena её пока нет, но в Arena Hard — автоматическом рейтинге моделей, где оценки выставляет GPT-4 Turbo по сравнению с GPT-4, — модель уже пробилась на 3 место, уступив лишь o1-mini и o1-preview. Попробовать пообщаться с моделью можно на официальном сайте Nvidia или на HuggingChat. Впрочем, наверняка сейчас популярные сервисы начнут у себя раскатывать.
Технологии32 дня назад
Похожие новости
Сережа Мезенцев на Yandex ML Prize: Встреча с учеными раскрывает роль науки в ИИ
Общество
1 день назад +3
Новые игровые мониторы AOC и LG с высокими частотами обновления
Технологии
15 часов назад +3
Starknet увеличивает TPS в 4 раза и снижает комиссии в 5 раз
Экономика
4 часа назад +1
Пользователь успешно обманул ChatGPT, заставив его показать средний палец
Технологии
3 часа назадХакатон по искусственному интеллекту собрал студентов и экспертов в Санкт-Петербурге
Общество
3 часа назад +5
BORK представляет элитные нарды за 486 тысяч рублей с уникальным дизайном
Происшествия
1 час назад +1