NVIDIA анонсировала новые модели Llama 3.1, превзошедшие GPT-4o и Claude 3.5

NewSpace Times

NVIDIA молча выпустила файнтюн модели Llama 3.1 70B, которая превзошла по производительности GPT-4o и AnthropicAI Claude Sonnet 3.5. 85.0 на Arena Hard, 57.6 на AlpacaEval 2 LC, и 8.98 MT-Bench Превосходит GPT-4o и Claude 3.5 Sonnet на Нескольких бенчмарках Основан на Llama-3.1-70B-Instruct и обучен с помощью RLHF REINFORCE Выпущена также Llama-3.1-Nemotron-70B-Reward #2 на RewardBench Доступно на Hugging Face

Технологии573 дня назад

addmeto

Nvidia выпускают опенсорсную LLM Nemotron ну точнее это llama-3.1-nemotron-70B-Instruct, т.е. большая llama доученная на в нвидии . Утверждается что эта 70B модель лучше чем gpt-4o и Sonnet 3.5. Я еще не проверял, но если тесты подтвердятся, то сейчас начнется... В камементах правильно указывают, что даже на арене показатели этой модели на уровне LLama 3.1 и уж точно не догоняет gpt-4o

Технологии571 день назад

Nvidia опубликовали новую модель Llama-3.1-Nemotron-70B-Instruct-HF. Модель занимает первое место по некоторым бенчмаркам AlpacaEval, MT-Bench, Mean Response Length . В основе — опенсорсная Llama 3.1 от Meta , 70 млрд параметров и обучение методом RLHF с подкреплением человеческих отзывов . Тестируем тут. Meta признана в РФ экстремистской и запрещена

Технологии572 дня назад

Сфера Блогинга

Внезапно начали очень хвалить новую LLM-модель выложенную Nvidia — модель Nemotron 70B-Instruct представляет собой файн-тюнинг Llama 3.1, но по появляющимся заявлениям, превосходит в задачах кодинга и GPT-4o, и Claude 3.5 Sonnet. Правда, в официальной Chatbot Arena её пока нет, но в Arena Hard — автоматическом рейтинге моделей, где оценки выставляет GPT-4 Turbo по сравнению с GPT-4, — модель уже пробилась на 3 место, уступив лишь o1-mini и o1-preview. Попробовать пообщаться с моделью можно на официальном сайте Nvidia или на HuggingChat. Впрочем, наверняка сейчас популярные сервисы начнут у себя раскатывать.

Технологии572 дня назад

JavaRush – здесь становятся программистами

ИИ-модель Nvidia превзошла в тестах топовые модели OpenAI и Anthropic Модель Llama-3.1-Nemotron-70B-Instruct от Nvidia появилась на популярной ИИ-платформе Hugging Face без лишнего шума, но быстро привлекла внимание своими результатами в бенчмарках, которые оказались выше показателей GPT-4o OpenAI и Claude 3.5 Sonnet Anthropic . Подход Nvidia к созданию Llama-3.1-Nemotron-70B-Instruct заключался в улучшении модели Llama 3.1 с открытым исходным кодом от Meta с применением передовых методов обучения, включая обучение с подкреплением на основе обратной связи от человека RLHF . Этот метод позволяет ИИ учиться на предпочтениях пользователей, что может привести к более естественным и контекстуально уместным ответам. Способность модели обрабатывать сложные запросы без дополнительных подсказок или специализированных токенов выгодно отличает ее от других. Для компаний это означает меньшее количество ошибок, более полезные ответы и, в конечном итоге, лучшую удовлетворенность клиентов.

Технологии567 дней назад

NVIDIA анонсировала новые модели Llama 3.1, превзошедшие GPT-4o и Claude 3.5

Источники

13-летний подросток обнаружил уязвимость в блокчейне TON с помощью ИИ и получил 4000 долларов

OpenAI запускает инициативу Daybreak для автоматизации защиты от уязвимостей

Unitree представила пилотируемого меха-робота для гражданского использования

Завершение производства Tesla Model S и X: последние автомобили сошли с конвейера

Глава Nvidia предсказывает рост спроса на сантехников, электриков и сварщиков

Новые ИИ-сервисы для преобразования речи в текст: от Яндекс до Nothing

NVIDIA анонсировала новые модели Llama 3.1, превзошедшие GPT-4o и Claude 3.5

Ещё по теме

Источники

13-летний подросток обнаружил уязвимость в блокчейне TON с помощью ИИ и получил 4000 долларов

OpenAI запускает инициативу Daybreak для автоматизации защиты от уязвимостей

Unitree представила пилотируемого меха-робота для гражданского использования

Завершение производства Tesla Model S и X: последние автомобили сошли с конвейера

Глава Nvidia предсказывает рост спроса на сантехников, электриков и сварщиков

Новые ИИ-сервисы для преобразования речи в текст: от Яндекс до Nothing