2 октября, 10:58

AMD анонсировала малую языковую модель AMD-135M с открытым исходным кодом

AMD представила малую ИИ-модель AMD-135M  В области искусственного интеллекта AMD делает ставку не только на аппаратные мощности, но и разрабатывает программное обеспечение для удовлетворения потребностей своих клиентов. Последним достижением компании в области ПО стал выпуск малой AI-модели AMD-135M.  Читать далее
DNS_Club
DNS_Club
AMD представила малую ИИ-модель AMD-135M В области искусственного интеллекта AMD делает ставку не только на аппаратные мощности, но и разрабатывает программное обеспечение для удовлетворения потребностей своих клиентов. Последним достижением компании в области ПО стал выпуск малой AI-модели AMD-135M. Читать далее
AMD выпустила первую языковую модель ИИ — AMD-135M  Новая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на работу в частном бизнесе.  Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач.  Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250.  Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода.    PRO AI   ПОЛЕЗНЫЙ СОФТ   НОВОСТИ
PRO AI | ПОЛЕЗНЫЙ СОФТ | НОВОСТИ
PRO AI | ПОЛЕЗНЫЙ СОФТ | НОВОСТИ
AMD выпустила первую языковую модель ИИ — AMD-135M Новая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на работу в частном бизнесе. Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач. Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250. Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода. PRO AI ПОЛЕЗНЫЙ СОФТ НОВОСТИ
AMD представила свою первую языковую модель искусственного интеллекта - AMD-135M  AMD-135M - маломасштабная языковая модель, которая относится к семейству Llama и предназначена для использования в частных компаниях.   Неясно, связано ли появление этой модели с недавним приобретением стартапа Silo AI, поскольку сделка ещё не завершена, но это явный шаг к удовлетворению конкретных потребностей клиентов с помощью предварительно обученной модели, созданной на оборудовании компании.    Основное преимущество AMD заключается в использовании спекулятивного декодирования, что позволяет одновременно генерировать несколько токенов, хотя это и увеличивает потребление энергии из-за роста объема передаваемых данных.   AMD-Llama-135M и AMD-Llama-135M-code предлагаются в двух версиях, каждая из которых оптимизирована для выполнения определенных задач с учетом технологии спекулятивного декодирования.   Базовая модель была обучена на 670 миллиардов токенов за шесть дней с использованием четырех узлов AMD Instinct MI250, а дальнейшее дообучение модели на 20 миллиардов токенов заняло четыре дня.
Хлебни ИИ - про искусственный интеллект
Хлебни ИИ - про искусственный интеллект
AMD представила свою первую языковую модель искусственного интеллекта - AMD-135M AMD-135M - маломасштабная языковая модель, которая относится к семейству Llama и предназначена для использования в частных компаниях. Неясно, связано ли появление этой модели с недавним приобретением стартапа Silo AI, поскольку сделка ещё не завершена, но это явный шаг к удовлетворению конкретных потребностей клиентов с помощью предварительно обученной модели, созданной на оборудовании компании. Основное преимущество AMD заключается в использовании спекулятивного декодирования, что позволяет одновременно генерировать несколько токенов, хотя это и увеличивает потребление энергии из-за роста объема передаваемых данных. AMD-Llama-135M и AMD-Llama-135M-code предлагаются в двух версиях, каждая из которых оптимизирована для выполнения определенных задач с учетом технологии спекулятивного декодирования. Базовая модель была обучена на 670 миллиардов токенов за шесть дней с использованием четырех узлов AMD Instinct MI250, а дальнейшее дообучение модели на 20 миллиардов токенов заняло четыре дня.
Заплати рублями за получение карты от Газпромбанк ❤️
        
        Оформи бесплатную дебетовую карту от Газпромбанка через нас и мы переведем тебе вознаграждение
Tek.fm
Tek.fm
Заплати рублями за получение карты от Газпромбанк ❤️ Оформи бесплатную дебетовую карту от Газпромбанка через нас и мы переведем тебе вознаграждение
Все о блокчейн, мозге и WEB 3.0 в России и мире
Все о блокчейн, мозге и WEB 3.0 в России и мире
AMD выпустила свою первую малую языковую модель SLM под названием AMD-135M, она open source Модель включает 2 версии: AMD-Llama-135M общая и AMD-Llama-135M-code для кода . Модель обучена с нуля на ускорителях AMD Instinct MI250 с 670 млрд токенов.
Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M.  Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI  сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет . Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования.  Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных.
был бы ты человек - IT, digital
был бы ты человек - IT, digital
Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M. Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет . Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования. Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных.