19 февраля, 11:09

OpenAI и Paradigm представили EVMBench для оценки ИИ агентов

OpenAI
OpenAI
OpenAI в сотрудничестве с Paradigm представили EVMBench инструмент для оценки работы ИИ агентов со смарт контрактами Решение позволяет тестировать насколько корректно модели анализируют и взаимодействуют с контрактами в среде EVM
Video is not supported
Machinelearning
Machinelearning
OpenAI и Paradigm представили инструмент для оценки навыков ИИ в защите смарт контрактов EVMbench специализированный фреймворк который проверяет насколько хорошо языковые модели справляются с 3 задачами находят баги в коде смарт контрактов эксплуатируют их в контролируемой среде и исправляют без нарушения логики контракта Тестовая база построена на реальных примерах багов найденных ранее в ходе аудитов и профильных соревнований Авторы рассчитывают что EVMbench станет отраслевым стандартом что важно для защиты активов в секторе децентрализованных финансов где исправить ошибку после деплоя уже невозможно openai com Google обновила NotebookLM Теперь в NotebookLM сгенерированные презентации можно дорабатывать прямо в диалоге с ИИ без ручной правки каждого слайда Достаточно написать что изменить и модель перестроит контент сама Второе обновление экспорт в PPTX Готовую презентацию можно скачать и открыть в Microsoft PowerPoint Поддержка Google Slides анонсирована но пока не запущена NotebookLM в сети Х Perplexity полностью отказывается от рекламы ИИ поисковик прекратил эксперименты с рекламной монетизацией посчитав что она фундаментально противоречит миссии сервиса Несмотря на то что стартап одним из первых начал тестировать спонсорские ответы в 2024 году сейчас руководство решило свернуть эту инициативу Представители компании пояснили что их главная ценность это точность и объективность информации Даже если промо блоки четко маркированы и технически не влияли на генерацию текста сам факт их наличия заставляет людей сомневаться в честности ответов В Perplexity пришли к выводу что для удержания платных подписчиков пользователь должен быть уверен что получает лучший возможный ответ не искаженный коммерческими интересами рекламодателей ft com Gemini теперь может генерировать музыку В чат бот добавили модель Lyria 3 от DeepMind На вход она принимает текст картинку или видео а если указать в запросе имя исполнителя Gemini создаст трек в похожем стиле но скопировать артиста напрямую не получится Инструмент в бете но уже пишет полноценные треки на английском немецком испанском французском хинди японском корейском и португальском языках Вся музыка созданная через Lyria 3 получает метку SynthID blog google В MIT приспособили языковую модель для удешевления производства лекарств Команда инженеров химиков института адаптировала архитектуру LLM для нужд биотехнологий Созданный алгоритм помогает промышленным дрожжам Komagataella phaffii эффективнее производить сложные белки используемые в вакцинах и препаратах от рака Суть разработки решении проблемы генетических синонимов Одна и та же аминокислота может кодироваться разными триплетами ДНК кодонами но на классических методах оптимизации выбор самых часто встречающихся вариантов нередко приводит к дефициту ресурсов клетки и снижению выработки Инженеры обучили модель на геноме дрожжей заставив ее воспринимать ДНК как текст ИИ не просто запомнил частоту кодонов но и усвоил скрытый контекст синтаксис их взаимодействия В тестах на реальных белках включая человеческий гормон роста и моноклональные антитела последовательности от ИИ превзошли результаты лучших коммерческих инструментов в 5 случаях из 6 Технология обещает сократить расходы на разработку новых лекарств которые на этапе подготовки производства сейчас составляют до 20 от общего бюджета news mit edu ai machinelearning big data news ai ml
TKACH | Crypto
TKACH | Crypto
Новый инструмент для AI агентов в криптоиндустрии OpenAI и Paradigm представили EVMBench специализированный инструмент для оценки работы AI агентов со смарт контрактами Он моделирует уязвимости в среде EVM проверяя насколько эффективно AI агенты могут обнаруживать и исправлять ошибки
CRYPTO GUYS 👽| 😼
CRYPTO GUYS 👽| 😼
OpenAI в сотрудничестве с Paradigm представили EVMBench инструмент для оценки работы ИИ агентов со смарт контрактами Решение позволяет тестировать насколько корректно модели анализируют и взаимодействуют с контрактами в среде EVM CRYPTO GUYS