7 марта, 12:17

AIRI представляет автоматизированный инструмент для оптимизации GPU ядер в разработке ИИ

AIRI представляет автоматизированный инструмент для оптимизации GPU ядер в разработке ИИ
Раньше всех
Раньше всех
Разработан инструмент для удешевления вычислений при разработке ИИ Специалисты Института искусственного интеллекта AIRI опубликовали в открытом виде ИИ систему которая позволяет в полностью автоматическом режиме генерировать и оптимизировать GPU ядра предназначенные для работы в сфере разработки нейросетей
OMG GPT: Midjourney, DeepSeek, IT
OMG GPT: Midjourney, DeepSeek, IT
LLM начали писать GPU ядра и теперь это можно использовать Институт AIRI выложил в открытый доступ фреймворк KernelEvo систему где LLM агенты автоматически создают и оптимизируют GPU ядра Ранее похожий подход показала Meta в проекте KernelEvolve где модели генерировали и улучшали ядра под разные платформы Однако тот код остался закрытым Как работает KernelEvo LLM генерирует варианты CUDA и Triton ядер автоматически запускаются тесты и профилирование система исправляет ошибки цикл повторяется до улучшения производительности Фактически это автоматический перебор решений вместо ручного процесса написал протестировал переписал В одном запуске может генерироваться до миллиона токенов кода и комментариев Зачем это нужно хорошо оптимизированное ядро ускоряет вычисления на десятки процентов на уровне больших кластеров это экономит тысячи GPU часов специалисты по низкоуровневой оптимизации GPU остаются крайне дефицитными Проект распространяется по MIT лицензии поэтому компании могут использовать его напрямую Особенно полезно для команд у которых нет собственных kernel инженеров но есть доступ к LLM API
Кратное ускорение вычислений за счёт автоматической эволюции GPU ядер   Исследователи AIRI выложили в открытый доступ фреймворк автоматической генерации и оптимизации GPU ядер сгенерированные им ядра более эффективны и позволяют снижать стоимость вычислений GPU ядра kernels реализуют ключевые операции в ИИ системах Часто их нужно оптимизировать тогда компании пишут собственные CUDA или Triton ядра операции ускоряются что позволяет экономить тысячи GPU часов и десятки миллионов рублей в год Но создавать такой код дорого и долго а подходящих инженеров мало KernelEvo заменяет ручной перебор гипотез автоматическими циклами поиска с обратной связью генерируя варианты CUDA или Triton реализации запуская тесты и исправляя ошибки GitHub GitVerse ТАСС Хабр
AIRI Institute
AIRI Institute
Кратное ускорение вычислений за счёт автоматической эволюции GPU ядер Исследователи AIRI выложили в открытый доступ фреймворк автоматической генерации и оптимизации GPU ядер сгенерированные им ядра более эффективны и позволяют снижать стоимость вычислений GPU ядра kernels реализуют ключевые операции в ИИ системах Часто их нужно оптимизировать тогда компании пишут собственные CUDA или Triton ядра операции ускоряются что позволяет экономить тысячи GPU часов и десятки миллионов рублей в год Но создавать такой код дорого и долго а подходящих инженеров мало KernelEvo заменяет ручной перебор гипотез автоматическими циклами поиска с обратной связью генерируя варианты CUDA или Triton реализации запуская тесты и исправляя ошибки GitHub GitVerse ТАСС Хабр