22 октября, 18:34
Anthropic представила обновленные модели Claude 3.5 Sonnet и Haiku с новыми функциями управления компьютером
БлоGнот
Anthropic выкатили новые модели — точнее, обновленную Sonnet 3.5 и новую версию самой маленькой модели Haiku 3.5. Sonnet стала еще круче в написании кода хотя она и так, по общему признанию, справлялась с этим лучше других моделей и получила новую способность — computer use. Эта способность позволяет LLM использовать физический компьютер так, как это сделал бы человек — смотреть на экран, управлять программами, заполнять формы. Пока она в бете, но можно её использовать через API. В API, кстати, уже доступна версия, помеченная сегодняшним числом, так что можно пробовать. Haiku оправдывает свое звание малой модели и работает очень быстро — при этом обходя по тестам Opus 3, а в задачах на работу с кодом — буквально вчерашнюю версию Sonnet и GPT-4o. Она будет доступна до конца месяца через API, пока только в текстовом виде. Поневоле задумаешься — а Opus 3.5 вообще выйдет?
Технологии27 дней назад
Denis Sexy IT 🤖
Antropic показал новые модели Sonnet 3.5 New — эта чуть лучше прошлой все равно вы ее для кода используете, на 5% лучше его пишет , Haiku 3.5 — эта их конкурент gpt4o-mini получше, но дороже . Тут у Игоря подробный разбор релиза. Мне же понравилось другое, они показали как примерно будет работать управление компьютером агентом — посмотрите видео, я их чуть обрезал. То есть через какое-то время, мышку можно будет не двигать, просто говорите компьютеру что хотите — и оно делает скриншотя экран – ну как в Sci-Fi фильмах только сегодня Уже доступно через апи, вот код из примера, а тут документация Ботоводы, наверное, потирают руки
Технологии27 дней назад
Двоичный кот
Anthropic показала обновлённые Claude-3.5 Sonnet и Haiku, которые могут управлять компьютером за вас «А может тебе дать ещё ключ от квартиры, где деньги лежат?» Способность новых моделек работать в качестве ИИ-агентов — это фича, говорящая сама за себя. И доступна она пока только по API: например, компаниям-партнёрам вроде разработчиков браузера Arc. Разумеется, она во всём превосходит GPT-4o — это логично, та ведь устарела. Но главное, что свежий Sonnet стал лучше в кодинге. Если у вас слишком прямые руки, то вот страница кода с демо-видео. А здесь доки, дабы изучить всё от корки до корки.
Технологии27 дней назад
Сфера Блогинга
Anthropic выкатили новые модели — точнее, обновленную Sonnet 3.5 и новую версию самой маленькой модели Haiku 3.5. Sonnet стала еще круче в написании кода хотя она и так, по общему признанию, справлялась с этим лучше других моделей и получила новую способность — computer use. Эта способность позволяет LLM использовать физический компьютер так, как это сделал бы человек — смотреть на экран, управлять программами, заполнять формы. Пока она в бете, но можно её использовать через API. В API, кстати, уже доступна версия, помеченная сегодняшним числом, так что можно пробовать. Haiku оправдывает свое звание малой модели и работает очень быстро — при этом обходя по тестам Opus 3, а в задачах на работу с кодом — буквально вчерашнюю версию Sonnet и GPT-4o. Она будет доступна до конца месяца через API, пока только в текстовом виде. Поневоле задумаешься — а Opus 3.5 вообще выйдет?
Технологии27 дней назад
AI и точка.
Anthropic обновила модель Claude 3.5 Sonnet, выпустила быструю модель Claude 3.5 Haiku и добавила новые возможности работы с компьютером. По бенчмаркам новый Claude 3.5 Sonnet превосходит GPT-4o от OpenAI в понимании языка GPQA, MMLU и математике MATH Самой сильной стороной Claude традиционно является написание кода HumanEval . Интересно, что Claude теперь умеет работать с компьютером: не просто запускает код, но может видеть экран, двигать курсор, нажимать на кнопки и печатать. В модель Claude 3.5 Sonnet уже обновлена.
Технологии27 дней назад
Droider
Управление компьютером с помощью чат-бота! Anthropic провела масштабное обновление своей линейки ИИ-моделей. Компания представила улучшенный Claude 3.5 Sonnet, новый Claude 3.5 Haiku и интересную функцию управления компьютером. Claude 3.5 Sonnet значительно прокачался. Его показатели на тестах SWE-bench Verified выросли с 33.4% до 49% — это лучший результат среди всех публично доступных моделей, включая OpenAI. GitLab уже отметил 10-процентное улучшение в решении задач DevSecOps без потери скорости работы. Claude 3.5 Haiku — новая "быстрая" модель, которая при той же стоимости и скорости превосходит возможности Claude 3 Opus — предыдущего флагмана компании. На тех же тестах SWE-bench Verified она показала результат 40.6%, обойдя даже первую версию Sonnet и GPT-4o. Главной же инновацией стала функция управления компьютером для Claude 3.5 Sonnet – Computer use. Теперь ИИ может самостоятельно работать с интерфейсом как человек: перемещать курсор, нажимать кнопки, вводить текст. Особенность новой функции в том, что Claude обладает общими навыками работы с компьютером. Он может самостоятельно открывать браузер, проверять электронные таблицы, заполнять формы и выполнять множество других задач. Смотрите ролик, впечатляет! Запуск обновлённого Sonnet уже состоялся, Haiku появится до конца месяца. Computer use будет доступен через API Anthropic.
Технологии27 дней назад
Похожие новости
Эксперты Сбера провели урок по искусственному интеллекту в российских школах
Общество
6 часов назад +6
Переписка Маска и Альтмана раскрывает детали конфликта вокруг AGI
Технологии
1 день назадХакатон по искусственному интеллекту собрал студентов и экспертов в Санкт-Петербурге
Общество
2 часа назад +5
Пользователь успешно обманул ChatGPT, заставив его показать средний палец
Технологии
1 час назадСережа Мезенцев на Yandex ML Prize: Встреча с учеными раскрывает роль науки в ИИ
Общество
1 день назад +3
Telegram обновился до версии 11.4 с новыми функциями для мини-приложений
Технологии
1 день назад +22